1.Blast程序下载和安装
ftp://ftp.ncbi.nlm.nih.gov/blast/executables/release/LATEST在该目录中选择需要的blast程序,下载.
windows用户: 双击,在该文件所在目录下会生成一系列文件。在c:windows下创建名为NCBI.ini的配置文件,用记事本写入:
[NCBI] Data ="pathdata"
(注意:path代表你电脑上blast的安装目录)
Linux 用户:直接解压
2.下载数据库 ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/ 也可以用fasta文件创建自己的数据库
3.格式化数据库
windows用户: 进入cmd,使用cd /d 命令打开blast程序所在文件夹。
linux用户,也需要在终端内进入/blast/bin/ 文件夹, 也可使用export PATH=$PATH:/path/to/blast/bin/ 省去进入blast文件夹
输入:formatdb -i databasename -p F -o T
databasename表示自己选择的数据库(最好使用绝对路径)
-i input file 参数用于指定需要格式的数据库
-p type of file 用于指定文件类型,T 为蛋白质,F为核酸,默认为 T
-o parse options 用于指定是否解析序列ID并创建索引 T 为创建,F为不创建,默认为F。如果不用T,会提示[NULL_Caption] WARNING: “inputseq”: Could not find index files for database “databasename”
可以输入formatdb –help 来获取相关参数的解释和帮助。
4.blastall
windows用户: 进入cmd,使用cd /d 命令打开blast程序所在文件夹。
linux用户,也需要在终端内进入/blast/bin/ 文件夹。
输入:blastall -p blastn -d databasename -i inputfile -o outputfile
-p program name 为需要使用的程序名
blastn 为核酸序列对比搜索
blastp 为蛋白质序列对比搜索
blastx 为用被翻译的核酸序列在蛋白质数据库中搜索
tblastn 为 用蛋白质序列在 [核酸序列翻译后数据库] 中搜索
tblastx 为用翻译后的核酸序列 在 核酸序列翻译后数据库中搜索
可以输入blastall - 来获取相关参数的解释和帮助。
-d databasename 指定所使用的数据库名称
-i inputfile 待搜索的序列文件(最好使用绝对路径)
-o outputfile 指定保存结果的文件(最好使用绝对路径)
注:通过Perl 脚本实现本地化运行BLAST
1 2 3 4 5 6 7 8 9 10 |
|