CVhaplot (Perl scripts)
一个使用一致推举法(consensus vote approach)进行细胞核DNA单倍型推测的软件包。可以自动进行输入数据格式的转换和一致推举分析。[软件下载]
自上世纪90年代初期分子生态学研究逐步普及以来,研究人员基本上是依赖于细胞器DNA标记来获得分子水平的谱系数据,而未能有效使用信息量几乎无限的细胞核DNA 谱系数据,最根本的原因是大多数高等生物都是二倍体(或多倍体),在每一个遗传位点,基因组都包含两个(或多个)拷贝同源基因(称为等位基因,又称为单倍型),而且在很多数情况下这两个同源基因在分子结构上都有差异,形成所谓杂合体。现有的DNA序列分析技术都不能直接把这样两个不同的基因区分开来,即不能对杂合体的DNA分子结构进行直接解析,从而严重限制了细胞核DNA标记的大规模使用。细胞核DNA单倍型推测的问题是现阶段分子生态学和进化研究领域的技术难题,严重制约了细胞核DNA标记在群体遗传分析中的有效使用(Avise 2000; Zhang & Hewitt 2003)。
虽然自上世纪90年代初研究人员就从实验分析和统计分析两方面尝试解决这一难题(Zhang & Hewitt 2003),特别是在世纪之交以来统计分析算法方面取得了空前的进展,但研究人员无法确认这些所谓的可靠算法和技术所推测出的结果是否真的可靠,无法保证后续的进化分析所依赖的数据是准确无误的。我们建立了单倍型推测的一致推举法(consensus vote approach),较好地解决了这个难题:该方法能把统计算法推测出来的单倍型分成两组——可靠组和不尽可靠组,对于可靠组的单倍型可直接用于进化分析,而对于不尽可靠组的单倍型则必须通过实验进行验证。CVhaplot旨在使这一方法逐步实现自动化。
参考文献:Huang ZS, Ji YJ & Zhang DX (2008). Haplotype reconstruction for scnp DNA: a consensus vote approach with extensive sequence data from populations of the migratory locust (Locusta migratoria). Molecular Ecology. doi: 10.1111/j.1365-294X.2008.03730.x