分类: 医学研究

linux文本处理命令是一类对文件进行操作的命令,通过使用文本处理命令,可以轻松的对文件进行排序,拆分,合并等操作,熟练掌握文本处理命令,在生物信息文本处理中,有十分重要的意义。

一、cat 查看文件内容命令

以下为最常用的几个命令实例:

注意事项:

遇到大文件的时候,不要直接cat,因为cat会一直把所有内容打印到屏幕上,造成长时间处于打印状态,如遇到这种情况,连续不间断的敲击ctrl+c组合键退出打印状态

相关衍生命令:

cat还有两个常用的相关命令:

1.zcat  查看压缩文件

2.tac  从结尾往上看内容

 

二、sort 排序命令

对数据的某一列按照文本,数字等排序方法进行排序,也可以进行字符内排序,以下为最常用的几个命令实例

 

三.uniq 去除重复命令

对相同的行去重复,统计重复,保留重复等,还可指定某一列做为去重复关键字去重复,以下为最常用的几个命令实例
注意事项:

uniq需要配合sort进行使用,把重复的内容排序到一起,以下为最常用的几个命令实例

四.wc 统计命令

统计指定文件中的字节数、字数、行数,并将统计结果显示输出,以下为最常用的几个命令实例

五.grep/egrep命令

grep为过滤命令,一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,常用命令如下:
grep一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式,这条命令和grep -E等价。虽然一般情况下,基本正则表达式就够用了,以下为最常用的几个命令

六.sed命令

sed是一个强大的按行处理的命令,常用的命令如下:

七.awk命令

是一个最强大的文本分析工具,以下列常用文本处理的写法:

八.cut命令

cut命令命令从文件的列剪切字节、字符、域,并将这些字节、字符,域,输出出来,下面为几个常见的用法:

九.split命令

split命令可以按照行或者按照字节分割文件,以下列常用文本处理的写法:

十.paste命令

Paste命令可按列合并命令,可以很轻松的将两个文件按列合并,下面是常见的举例: 

十一.xargs

xargs用作替换工具,读取输入数据重新格式化后输出。Xargs命令常跟管道连用,处理管道中的数据流:
 

十二.comm

comm命令比较两个文件的相同和不同,下面为常用的命令举例:
注意事项:两个比较的文件需要排序后进行
好了linux常用命令就介绍到这里,按照这些实例好好练习,加上自己的融会贯通,相信你很快就会成为快速文本处理的高手
最近文章