Miniasm(CentOS7.6 鲲鹏) 鲲鹏

提供Miniasm基于鲲鹏云服务器预装环境,可在鲲鹏云服务器上一键安装
了解咨询

雷达评级

A

用户规模

-

产品上线

-

商品详情

商品亮点
  • 鲲鹏兼容:在鲲鹏云服务器正常运行
  • 保持原生:基于社区开源组件的官方源码编译安装
  • 版本自由:采用稳定的Miniasm版本
商品说明
版本: V1.0 交付方式: 镜像
适用于: Linux 上架日期: 2020-04-23
Miniasm是一种非常快速的基于OLC的从头汇编程序,用于嘈杂的长时间读取。它以全对全读取自映射(通常通过minimap)作为输入,并以GFA格式输出组装图。与主流汇编程序不同,miniasm没有共识步骤。它简单地连接多条读取序列以生成最终的单位 序列。因此,每碱基错误率类似于原始输入读取。

到目前为止,miniasm处于早期开发阶段。仅在十几个PacBio和Oxford Nanopore(ONT)细菌数据集上进行了测试。包括定位步骤在内,组装细菌基因组大约需要3分钟。
对于秀丽隐杆线虫 PacBio数据集(仅使用40X,而不是整个数据集),miniasm使用16个CPU在约10分钟内完成了组装,包括重复的读取。组件总大小为105Mb;N50为1.94Mb。相比之下,HGAP3生产的104Mb组件的N50为1.61Mb。该点状图给出了最小装配(在X轴上)和HGAP3装配(在Y轴上)的整体视图。它们大致可比。当然,HGAP3共有序列更加准确。此外,在整个数据集(约30分钟内完成)中,miniasm N50降至1.79Mb。Miniasm仍然需要改进。

Miniasm确认,至少对于高覆盖率的细菌基因组,可以从原始PacBio或ONT读数生成长重叠群,而无需进行错误校正。它还显示了minimap可以用作读取重叠器,尽管它可能不如MHAP和DALIGNER等更复杂的重叠器敏感。结合长期使用的纠错器和共识工具,最小化可能也可用于生产高质量的装配体。

用户案例

暂无,请等待更新