注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

小楼一夜听风雨

计算机知识、分子模拟、Linux学习,与您共分享!

 
 
 

日志

 
 

awk的内建函数  

2010-07-07 12:23:30|  分类: Linux学习 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

awk的内建函数

1. 字符串函数
sub
函数匹配记录中最大、最靠左边的子字符串的正则表达式,并用替换字符串替换这些字符串。如果没有指定目标字符串就默认使用整个记录。替换只发生在第一次匹配的时候。格式如下:

            sub (regular expression, substitution string):
            sub (regular expression, substitution string, target string)

实例:

            $ awk '{ sub(/test/, "mytest"); print }' testfile
            $ awk '{ sub(/test/, "mytest"); $1}; print }' testfile

第一个例子在整个记录中匹配,替换只发生在第一次匹配发生的时候。如要在整个文件中进行匹配需要用到gsub
第二个例子在整个记录的第一个域中进行匹配,替换只发生在第一次匹配发生的时候。
gsub
函数作用如sub,但它在整个文档中进行匹配。格式如下:

            gsub (regular expression, substitution string)
            gsub (regular expression, substitution string, target string)

实例:

            $ awk '{ gsub(/test/, "mytest"); print }' testfile
            $ awk '{ gsub(/test/, "mytest"), $1 }; print }' testfile

第一个例子在整个文档中匹配test,匹配的都被替换成mytest
第二个例子在整个文档的第一个域中匹配,所有匹配的都被替换成mytest
index
函数返回子字符串第一次被匹配的位置,偏移量从位置1开始。格式如下:

          index(string, substring)

实例:

$ awk '{ print index("test", "mytest") }' testfile

实例返回testmytest的位置,结果应该是3
length
函数返回记录的字符数。格式如下:

            length( string )
            length

实例:

            $ awk '{ print length( "test" ) }'
            $ awk '{ print length }' testfile

第一个实例返回test字符串的长度。
第二个实例返回testfile文件中第条记录的字符数。
substr
函数返回从位置1开始的子字符串,如果指定长度超过实际长度,就返回整个字符串。格式如下:

            substr( string, starting position )
            substr( string, starting position, length of string )

实例:

            $ awk '{ print substr( "hello world", 7,11 ) }'

上例截取了world子字符串。
match
函数返回在字符串中正则表达式位置的索引,如果找不到指定的正则表达式则返回0match函数会设置内建变量RSTART为字符串中子字符串的开始位置,RLENGTH为到子字符串末尾的字符个数。substr可利于这些变量来截取字符串。函数格式如下:

            match( string, regular expression )

实例:

$ awk '{start=match("this is a test",/[a-z]+$/); print start}'
$ awk '{start=match("this is a test",/[a-z]+$/); print start, RSTART, RLENGTH }'

第一个实例打印以连续小写字符结尾的开始位置,这里是11
第二个实例还打印RSTARTRLENGTH变量,这里是11(start)11(RSTART)4(RLENGTH)
toupper
tolower函数可用于字符串大小间的转换,该功能只在gawk中有效。格式如下:

            toupper( string )
            tolower( string )

实例:

$ awk '{ print toupper("test"), tolower("TEST") }'

split函数可按给定的分隔符把字符串分割为一个数组。如果分隔符没提供,则按当前FS值进行分割。格式如下:

            split( string, array, field separator )
            split( string, array )

实例:

            $ awk '{ split( "20:18:00", time, ":" ); print time[2] }'

上例把时间按冒号分割到time数组内,并显示第二个数组元素18

2. 时间函数
systime函数返回从197011开始到当前时间(不计闰年)的整秒数。格式如下:

systime()

实例:

$ awk '{ now = systime(); print now }'

strftime函数使用C库中的strftime函数格式化时间。格式如下:

systime( [format specification][,timestamp] )

Table 3. 日期和时间格式说明符

格式

描述

%a

星期几的缩写(Sun)

%A

星期几的完整写法(Sunday)

%b

月名的缩写(Oct)

%B

月名的完整写法(October)

%c

本地日期和时间

%d

十进制日期

%D

日期 08/20/99

%e

日期,如果只有一位会补上一个空格

%H

用十进制表示24小时格式的小时

%I

用十进制表示12小时格式的小时

%j

11日起一年中的第几天

%m

十进制表示的月份

%M

十进制表示的分钟

%p

12小时表示法(AM/PM)

%S

十进制表示的秒

%U

十进制表示的一年中的第几个星期(星期天作为一个星期的开始)

%w

十进制表示的星期几(星期天是0)

%W

十进制表示的一年中的第几个星期(星期一作为一个星期的开始)

%x

重新设置本地日期(08/20/99)

%X

重新设置本地时间(120000)

%y

两位数字表示的年(99)

%Y

当前月份

%Z

时区(PDT)

%%

百分号(%)

实例:

            $ awk '{ now=strftime( "%D", systime() ); print now }'
            $ awk '{ now=strftime("%m/%d/%y"); print now }'

3. 内建数学函数

函数名称

返回值

atan2(x,y)

y,x范围内的余切

cos(x)

余弦函数

exp(x)

求幂

int(x)

取整

log(x)

自然对数

rand()

随机数

sin(x)

正弦

sqrt(x)

平方根

srand(x)

xrand()函数的种子

int(x)

取整,过程没有舍入

rand()

产生一个大于等于0而小于1的随机数

 

  评论这张
 
阅读(889)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017