0 Comments

Soap2/ SOAPaligner短序列比对软件用法

发布于:2015-10-13  |   作者:admin  |   已聚集:人围观

Soap2/ SOAPaligner 短序列比对软件,没有提供源代码,所以只能下载对应版本,如果没有就联系官方。

Usage:

1.    下载压缩包,解压之后包含两个二进制文件,2bwt-builder 和 soap

2.    首先使用2bwt-builder对基因组建索引

2bwt-builder <FastaPath/YourFasta> #即基因组文件

3.    SE比对

./soap –a <reads_a> -D <index.files> -o <output></output>

4.    Paired-end比对

./soap –a <reads_a> -b <reads_b> -D <index.files> -o <PE_output> -2 <SE_output> -m <min_insert_size> -x <max_insert_size>

5.    参数说明

-D   字符   基因组建索引时候的前缀名称(注意,不是基因组文件的名称)

-a   STR   如果是single-end就输入single-end文件路径,paired-end则输入其中一端的reads文件路径

-b   STR   single-end就不用输入了,paired-end的时候输入另外一端reads文件路径

-o   STR   输出比对结果文件的路径(包括文件名称)

-2   STR   输出比对上但是不是成对reads比对上的序列的文件路径(包含文件名称)。Single-end不必输入,这个文件包含的序列都是一端被比对上的序列。

-u   STR   在输出文件中输出没有被比对上的reads [none]

-m   INT   最小插入片段,single-end不需要 [400]

-x   INT   最大插入片段 ,single-end不需要[600]

-n   INT   丢掉包含指定数量N的序列,默认5个。在质量控制的时候一般都做过N去除,这里就可以不管了。 [5]

-t     用序列输出的id代替序列名称,(慎重使用), [none]

-r   INT  比对到多个位置的序列如何输出,1-不输出,2-任意输出一次,3-全部输出。全部输出的时候,同一条reads会有多个记录,之前看到有朋友说比对结果的reads统计数量变多,就是这个原因。

-R     RF alignment for long insert size(>=  2k  bps)  PE  data, [none] FR alignment(长片段比对才使用?)

-l   INT   长reads的时候使用。从5‘端取指定长度碱基作为种子先比对,如果能比上再比对全长的reads。

-v   INT   一条read允许的错配数量, [2]

-M   INT   read或者read种植匹配的方式(不超过2个错配) [4] #没太明白是啥意思

       0: exact match only 只取完全匹配的

       1: 1 mismatch match only 取1个错配的

       2: 2 mismatch match only 取2个错配的

       3: [gap] (coming soon)

       4: find the best hits 取最佳的

-p   INT   线程, [1]

 
标签:生物信息学软件(5)
    输入验证码:
点击我更换验证码