sort用来排序，缺省是对整行文件进行排序。比较难于理解的是Sort支持指定字段排序。

sort支持字段比较，用好这个功能常常可以省去比如用awk来截取字段再排序这样的操作，大大地简化操作。

先上示例

先看一完例子，有了功能上的认识之后，再看【关于sort的字段】一节的说明。

第二字段作为Key排序

# 命令行
sort -k2,2 

# 输入
1 c x
2 b y
3 a z
4 a w

# 输出，第一、三个字段不影响，所以第三个字段的z是在w之前
3 a z
4 a w
2 b y
1 c x

第二字段到最后一个字段（即行尾）作为Key排序

# 命令行
sort -k2

# 输入
1 c x
2 b y
3 a z
4 a w

# 输出，Key包含了第三个字段，第三个字段的w、z顺序正确
4 a w
3 a z
2 b y
1 c x

第二字段作为Key排序，从第3个字段开始算（即忽略这个字段的前面2个字符）

# 命令行
sort -k2.3,2

# 输入，和前面的例子相同
1 1c x
2 2b y
3 3a z
4 4a w

# 输出，忽略第二字段的前2个字符（第一字符是空格）
3 3a z
4 4a w
2 2b y
1 1c x

忽略字段开头的空白

缺省字段的值是包含前面空白的。即这样当分隔字段的空白不一致时（有使用Tab、有一个空格，有2个空格），排序就乱了。

选项-b, --ignore-leading-blanks即忽略字段开头的空白。字段声明中可以有选项。

# 命令行，对第二字段为Key排序
sort -k2,2

# 输入
1  c x
2 b y
3  a z
4 a w

# 输出，有空格的排在前面
3  a z
1  c x
4 a w
2 b y

# 命令行，对第二字段为Key排序，使用选项b
sort -k2b,2

# 输出，字段的开头的空白不影响排序了
3  a z
4 a w
2 b y
1  c x

多个排序Key

# 命令行，第二字段为第一Key排序，第三字段到行尾的内容为第二Key
sort -k2b,2 -k3

# 输入
1  c x
2 b y
3  a z
4 a w
5 a x

# 输出，有空格的排在前面
4 a w
5 a x
3  a z
2 b y
1  c x

有用的排序选项

调整输出

-r, --reverse
反序输出
-u, --unique
去重。即如果有多个相同的，只输出一个。
-b, --ignore-leading-blanks
忽略开头的空白
-R, --random-sort
随机排序，效果上不是排序，是打乱。
# 实际上是以内容的Hash值来排序。

排序方式

-n, --numeric-sort
按数字类型排序，1 < 02 < 3。
如果按字符排序，则是 02 < 1 < 3。
-g, --general-numeric-sort
按数字类型排序，支持通用记数，即认识1.234E10。会更慢并且有舍入问题（可能1.2345678 > 1.2345679）
详见What’s the difference between –general-numeric-sort and –numeric-sort options in gnu sort
-V, --version-sort
以版本号的方式排序。这个功能很霸气啊！
-M, --month-sort
以月份的方式排序。 (unknown) < JAN < ... < DEC
-h, --human-numeric-sort
数据值排序，识别K M G后缀，如2K 1G 1.1M

关于sort的字段

选项是-k, --key=KEYDEF。

KEYDEF = pos1[,pos2]。

表示以行的第pos1到第pos2（包含）的内容作为排序的Key。

字段的格式是F[.C][OPTS]，F是第几字段，C是从第几个字符开始（即忽略这个字符前面字符的差异）。

F和C都是从1开始。pos2字段的C为0时，表示是这个字段的最后一个字符。

pos1字段的C缺省是1，pos2字段的C缺省是0。

参考资料

FEATURED TAGS

生活 blog Java shell Unix/Linux unix Groovy jms mom middleware extension log4j philosophy 原则最佳实践 Shell generic gnu windows cmd tips dubbo Service 设计 class date i/o api design 服务优劣 Linux git week 日期星期计算月份命令行配置 Windows Dubbo 约定权限 Command Line 发布 java cooma release 微容器 github microcontainer 扩展点容器