商品说明
版本:
V1.0
|
交付方式:
镜像
|
适用于:
Linux
|
上架日期:
2020-04-23
|
Miniasm是一种非常快速的基于OLC的从头汇编程序,用于嘈杂的长时间读取。它以全对全读取自映射(通常通过minimap)作为输入,并以GFA格式输出组装图。与主流汇编程序不同,miniasm没有共识步骤。它简单地连接多条读取序列以生成最终的单位 序列。因此,每碱基错误率类似于原始输入读取。
到目前为止,miniasm处于早期开发阶段。仅在十几个PacBio和Oxford Nanopore(ONT)细菌数据集上进行了测试。包括定位步骤在内,组装细菌基因组大约需要3分钟。
对于秀丽隐杆线虫 PacBio数据集(仅使用40X,而不是整个数据集),miniasm使用16个CPU在约10分钟内完成了组装,包括重复的读取。组件总大小为105Mb;N50为1.94Mb。相比之下,HGAP3生产的104Mb组件的N50为1.61Mb。该点状图给出了最小装配(在X轴上)和HGAP3装配(在Y轴上)的整体视图。它们大致可比。当然,HGAP3共有序列更加准确。此外,在整个数据集(约30分钟内完成)中,miniasm N50降至1.79Mb。Miniasm仍然需要改进。
Miniasm确认,至少对于高覆盖率的细菌基因组,可以从原始PacBio或ONT读数生成长重叠群,而无需进行错误校正。它还显示了minimap可以用作读取重叠器,尽管它可能不如MHAP和DALIGNER等更复杂的重叠器敏感。结合长期使用的纠错器和共识工具,最小化可能也可用于生产高质量的装配体。