0 Comments

tophat2中的-r/--mate-inner-dist和--mate-std-dev参数

发布于:2015-12-25  |   作者:邓飞龙  |   已聚集:人围观

Tophat2 在RNA-Seq中的重要性自然不言而喻,废话不多说,直接说说其中两个让我纠结好久的参数——-r/--mate-inner-dist和--mate-std-dev。
 

首先解释两个参数:-r/--mate-inner-dist(官网解释:This is the expected (mean) inner distance between mate pairs. For, example, for paired end runs with fragments selected at 300bp, where each end is 50bp, you should set -r to be200. The default is 50bp.)也就是说,fragment - read length*2。fragment: 就是RNA被随机打断之后的长度,不包含adapter、index、primer之类的序列。read length: 当然就是最终得到的去掉接头等序列之后的reads(ps:我们从公司得到的序列似乎都是去掉接头之后的序列)。举例也是想说明:插入距离 = 建库fragment长度[300bp] - 每一端reads的长度[75bp*2] = 150bp。

tophat2插入片段长度
引自网络

解释好上一个参数,--mate-std-dev的意义就很好说了。因为建库的时候是将序列打断之后,赛选按照预设长度赛选,但是赛选的长度也不是绝对一致,所以我们这里设置一个fragment长度的标准差。

最后,如果拿不准这个以上两个参数,可以用部分数据跑一次tophat2或者bowtie2,得到成对的比对结果之后,拿出来计算一下就大致能够得出插入片段长度和标准差范围。Tophat2官方也提到,默认参数能够适应绝大多数情况的比对,因此,不想太折腾也可以将就默认的50bp/20bp。

引用:http://ccb.jhu.edu/software/tophat/faq.shtml#edit_dist

标签:
    输入验证码:
点击我更换验证码