Bioops

Bioinformatics=(ACGAAG->AK)+(#!/bin/sh)+(P(A|B)=P(B|A)*P(A)/P(B))

做生物信息常用到的linux命令

| Comments

1,统计一个序列文件中的序列个数(grep用好了可以非常快捷方便地处理一些数据)

grep -c '>' seqfile
2, 查看大文件头几行或最后几行
head seqfile
tail seqfile
3,文件行数
wc -l seqfile
4,矩阵格式的文件,提取其中的某几列(例如blast -m 8
 cut -f 1,2,11 seq.cblast > seq.abc
5,awk和sed

先学的perl,后知道awk和sed,认识到很多事情用awk和sed解决比写perl脚本方便多了

比如fastq转换fasta文件:

awk ‘NR % 4 == 1 || NR % 4 == 2′ myfile.fastq | sed -e ‘s/@/>/’ > myfile.fasta
6,screen管理远程任务,可以在远程会话断开后继续在后台运行,详见此文

7,vi/vim就不必细说了,编程必备。(emacs党自动替换成emacs)

8,暂时就这么多了。好长时间没做过东西了。等用到或者想到了再加。

Comments