大麦

Science与Nature开门钥匙之麦

发布时间:2021/9/1 12:07:52   点击数:

最近小编看完一遍麦类基因组文章,不是Nature就是Science,就连发在NSC子刊上的都少之又少!小编大吼一声,是时候总结探讨一波了!

图:某发育中的麦

(某美女亲自外拍所得,这技术杠杠的!透露一下HUAWEINOVA系列)

(猜猜是哪种麦?猜中有奖!)

还记得大明湖畔的大麦吗?记得当时小编牛逼哄哄的说到,大麦Nature系列不会终止下去,因为不是纯三装的,组装指标可提升空间还是特别大的。经过一年的时间,小编亲身经历了多个纯三麦类基因组的组装工作后,事实终于印证了小编心中的猜想,麦类基因组contigNMb再也不是梦!

究其原因,麦类基因组都属于高重复的超大复杂基因组,三代以前的技术基本上很难装的很好。为什么?其实很简单,因为三代很长,能跨越绝大部分的转座子重复区域。近期小编了解到,Pacbio平台在升级了2.1的酶和试剂后,单个Cell平均的subreads最高能达到18Kb以上,subreadN50能够达到27.7Kb,而酶的读长最长平均读长能到23.2Kb,N50一度达到了37.7Kb。有证据如下,具体见截图。

而绝大部分转座子的读长小于10Kb,如此长的读长使得subreads轻松跨越重复区域。而且懂纯三组装的小伙伴都知道,三代原始数据纠错完成后,实际在组装时用的是更长的subreads,远高于平均subreads读长,所以常规重复不再是麦类基因组组装中遇到的难题。当然遇到一些超长的大片段重复,光靠三代组装也很难解决。说到长,去年小编在山羊基因组的解读中还提到了Nanopore的技术。Nanopore的读长真的很长,最长reads能达到Mb,当然错误率也高,目前还面临产量不稳定等问题,相信后续新的平台(PromethION)上会有改善和提升。

对于组装,这些发表的麦类基因组中用到了哪些技术手段呢?一共包括了BAC+Illumina+Pacbio+GeneticMap+OpticalMap+HIC。如果所有技术都来一遍,相信小编一定能整出一个完美基因组,毕竟小编在多个物种中已经完成了组装contigNMb的跨越。不太具体的包括某昆虫(contigN7.93Mb),某哺乳动物(contigN7.1Mb),某禾本科(contigN.8Mb),某蔷薇科(contigN.7Mb),某水生动物(contigN.01Mb),某豆科(contigN.79Mb),某麦类(contigN.1Mb)…是不是实力秀了一波?这里面可没有双单被体材料哦!当然除了二倍体,小编还经历了三倍体,异源同源四倍体,六倍体,八倍体的组装。透露一下,八倍体的contigN50也达到了1Mb。~~~是不是走题了,小编有点停不下来的节奏~~~

好的,回归主题。小编的意思是,希望所有麦类基因组未来也能来到contigN50Mb级别的的跨越。毕竟组装太差了,后面大家都不好意思用了。放眼当前,如何达到最强组装指标?小编推荐:IlluminaPE+Pacbio+Nanopore+GeneticMap+OpticalMap+HIC。

简单解释一下用途:IlluminaPEreads用来Polish纠错;Pacbio:用来做主体组装;Nanopore:UltralongReads用来延伸contig/scaffold;OpticalMap:用来延伸scaffold/验证组装;HIC:用来挂载染色体/基因组纠错/验证组装/互作;GeneticMap:用来验证HIC/挂载/定位。如有见解不同,小编欢迎沟通!标红的是小编认为的必选项,其它为可选项。两者比起来,就是95分和98分的区别。不要问小编分是怎么算出来的,小编回答:经验!!

怀念一下当时的大麦组装结果(contigNKb),YY下一篇麦类Nature(ContigNMb),为麦类基因组操碎心的小编是不是应该榜上有名—某年某月某日,某麦于Nature杂志封面发表!

那已经发表的麦类基因组有哪些呢?小编总结如下,漏掉的麻烦各位读友补充哦!



转载请注明:http://www.xueguos.com/dmcf/22287.html

------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章