awk基础

前言

awk是由Alfred Aho, Peter Weinberger和 Brian Kernighan三人创造的,wak由三人的姓氏的首个字母组成
早期是在unix上实现的。在unix上的叫gawk既GNU awk

awk语法

  • awk命令形式
1
awk [-F|-f|-v] 'BEGIN{}//{command1;command2}END{}' file
  • 命令解释
命令 解释
[-F | -f | -v] -F指定分隔符,f调用脚本,-v 定义变量, var=value
‘ ‘ 引用代码块
BEGIN 初始代码块,在对每一行进行处理之前,初始化代码,主要是引用全局变量,设置FS分隔符
// 匹配代码块。可以是字符串或正则表达式
{} 命令代码块。包含一条或者多条命令,多条命令用分号分隔
END 结尾代码块。在对每一行进行处理之后再执行的代码块,主要是进行最终计算或输出结尾摘要信息
  • awk内置变量
变量名 解释 例子
FILENAME awk浏览的文件名
FNR 与NR类似,多文件记录不递增,每个文件都从1开始
FS 设置输入字段分隔符,同-F选项
NF 浏览记录的字段个数 awk ‘{print NF}’ file //显示每行有多少字段
$NF 最后一个字段的值 awk ‘{print $NF}’ file //将每行第NF个字段的值打印出来
NR 已读的记录数,理解为行号,多文件行号递增 awk ‘NR==5{print}’ file //显示第5行
OFS 输出数据时,每个字段间以OFS制定的字符作为分隔符 awk ‘{print $3,$5,$4}’ OFS=”\n” file
ORS 输出数据时,每行记录间以OFS制定的字符作为分羹 awk ‘{print $3,$5,$4}’ ORS=”\n” file

awk的大参数

  • 参数模式

    1
    awk [-F|-f|-v] 'BEGIN{} // {command1; command2} END{}' file
  • -F制定分隔符

可以不写,默认用空格。一个或多个连续的空格看做一个分隔符,也可以定义多个分隔符,
如果: -F[./]是指,同时以 “.”和”/“作为分隔符。

  • -f与 -v

awky的引用代码块

1
awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file
  • 操作符

引用代码块是一个编程环境,支持条件运算,逻辑运算等。

符号 解释 实例
== 等于,精确比较 awk ‘$3==”48” {print $0}’ file 只打印第3个字段等于”48”的记录
!= 不等于,精确比较 awk ‘$1 != “abc”‘ file //提取第一个字段不是abc的行
~ 匹配,与==相比不是精确比较 awk ‘{if ($4~/abc/) print $0}’ file //表示如果第四个字段包含abc,就打印整行
!~ 不匹配,不精确比较 awk ‘$0 !~ /abc/‘ file 打印整条不包含abc的记录
&& awk ‘{if ( $1==”a” && $2==”b” ) print $0}’ file //如果第1、第2个字段值是a和b,打印整行
|| awk ‘{if ($1==”a” || $1==”b”) print $0}’ temp //如果第1、第2个字段值是a或b,打印整行
> 大于 awk ‘$1>500 {print $2}’ file //如果字段1的值大于500,则打印字段2
>= 大于等于 awk ‘$1>=400 {print $2}’ file //如果字段1的值大于等于400,则打印字段2
< 小于 awk ‘$1<200 {print $2}’ file //如果字段1的值小于200,则打印字段2
<= 小于等于 awk ‘$1<=100 {print $2}’ file //如果字段1的值小于等于100,则打印字段2
+ awk ‘{print $3+10}’ file //字段3数值加10
- awk ‘{print $3-10}’ file //字段3数值减10
* awk ‘{print $3*10}’ file //字段3数值乘10
/ awk ‘{print $3/10}’ file //字段3数值除10
  • 字符匹配代码块
1
awk [-F|-f|-v] ‘BEGIN{} // {command1; command2} END{}’ file
  1. 字符匹配代码支持针对字符串的操作

  2. 字符匹配代码块支持正则表达式

  • if语句
  1. 必须在{}里,且比较内容用()扩起来,支持if else
1
2
3
4
5
awk -F: '{if($1~/abc/) print $1}' file     //简写

awk -F: '{if($1~/abc/) {print $1}}' file //全写

awk -F: '{if($1~/abc/) {print $1} else {print $2}}' file //if...else...
  1. 有时不用if语句也可以实现同样的效果图,如
    1
    2
    3
    awk -F: '{if($1~/abc/) {print $1}}' file    //$1为指定内容才显示

    awk -F: '$1~/abc/ {print $1}' file //与上面相同效果,没有用if语句,条件写在‘’外
  • while语句

与其他语言的while语句类似,条件为True时执行循环语句,False时不执行。

  • 数组
1
2
3
netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) print i,"\t",a[i]}'

netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) printf "%-20s %-10s %-5s \n", i,"\t",a[i]}'

应用

  1. 指定输出
1
2
3
4
5
6
7
awk -F: '{print NF}' helloworld.sh                                                       //输出文件每行有多少字段

awk -F: '{print $1,$2,$3,$4,$5}' helloworld.sh //输出前5个字段

awk -F: '{print $1,$2,$3,$4,$5}' OFS='\t' helloworld.sh //输出前5个字段并使用制表符分隔输出

awk -F: '{print NR,$1,$2,$3,$4,$5}' OFS='\t' helloworld.sh //制表符分隔输出前5个字段,并打印行号
  1. 指定分隔符并且输出
1
2
3
4
5
6
7
awk -F'[:#]' '{print NF}'  helloworld.sh                                                  //指定多个分隔符: #,输出每行多少字段

awk -F'[:#]' '{print $1,$2,$3,$4,$5,$6,$7}' OFS='\t' helloworld.sh //制表符分隔输出多字段

awk -F'[:#/]' '{print NF}' helloworld.sh //指定三个分隔符,并输出每行字段数

awk -F'[:#/]' '{print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$12}' helloworld.sh //制表符分隔输出多字段
  1. 简单计算

计算/home目录下,普通文件的大小,使用KB作为单位

1
2
3
ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",sum/1024,"KB"}'

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",int(sum/1024),"KB"}' //int是取整的意思
  1. 统计

统计netstat -anp 状态为LISTEN和CONNECT的连接数量分别是多少

1
netstat -anp|awk '$6~/LISTEN|CONNECTED/{sum[$6]++} END{for (i in sum) printf "%-10s %-6s %-3s \n", i," ",sum[i]}'

统计/home目录下不同用户的普通文件的总数是多少?

1
netstat -anp|awk '$6~/LISTEN|CONNECTED/{sum[$6]++} END{for (i in sum) printf "%-10s %-6s %-3s \n", i," ",sum[i]}'

统计/home目录下不同用户的普通文件的总数是多少?

1
ls -l|awk 'NR!=1 && !/^d/{sum[$3]++} END{for (i in sum) printf "%-6s %-5s %-3s \n",i," ",sum[i]}'

统计/home目录下不同用户的普通文件的大小总size是多少?

1
ls -l|awk 'NR!=1 && !/^d/{sum[$3]+=$5} END{for (i in sum) printf "%-6s %-5s %-3s %-2s \n",i," ",sum[i]/1024/1024,"MB"}'
  1. 复杂表格输出
1
2
3
4
5
6
7
8
9
10
11
12
13
awk 'BEGIN{math=0;eng=0;com=0;printf "Lineno.   Name    No.    Math   English   Computer    Total\n";printf "------------------------------------------------------------\n"}{math+=$3; eng+=$4; com+=$5;printf "%-8s %-7s %-7s %-7s %-9s %-10s %-7s \n",NR,$1,$2,$3,$4,$5,$3+$4+$5} END{printf "------------------------------------------------------------\n";printf "%-24s %-7s %-9s %-20s \n","Total:",math,eng,com;printf "%-24s %-7s %-9s %-20s \n","Avg:",math/NR,eng/NR,com/NR}' test0

cat test0

Marry 2143 78 84 77

Jack 2321 66 78 45

Tom 2122 48 77 71

Mike 2537 87 97 95

Bob 2415 40 57 62