本教程中,我们的目标是使用第二代和第三代全基因组测序 (WGS) 数据组装细菌基因组。我们将以此为例来探讨WGS数据分析,并探讨测序技术之间的差异。
NART
设计用于基于图谱的纳米孔扩增子(实时)分析,例如 16S rRNA 基因。NART
由NART
(Nanopore Amplicon Real-Time entry)和 NAWF
(Nanopore Amplicon snakemake
WorkFlow entry)组成。通过基于映射的策略提供从基础调用读取到最终计数矩阵的(实时)端到端解决方案。
LACA
是用于长扩增子一致性分析(例如 16S rRNA 基因扩增子分析)的可重复且可扩展的工作流程。它使用用snakemake
管理工作流程以及conda来
管理环境。
在此工作流程中,介绍了 Qiime2 和 R 中 16S rRNA 基因扩增子数据分析的主要步骤。本教程是为哥本哈根大学食品科学系的 MAC 2023 课程准备的。尽管这些步骤是为 Oxford Nanopore Tech (ONT) 测序设计的,但也在 Ilumina 短读长上进行了测试。
Python的Scanpy
包和Seurat
包一样,是单细胞数据处理的利器,其中,Scanpy
中有一种堆积的小提琴图,可以很好的展示marker的表达情况,但是在Seurat
中并没有内置命令。因此,我自己尝试提取数据并用ggplot2
包来画该图。
首先来展示以下画图的成果,如图
单细胞数据数据量很大,加重了分析的负担,但只要掌握好的方法和工具,就可以无往而不利。今年要说的这个如题,是因为在区分亚类的时候,提取了大类型并调整分辨率重新聚类计算的亚类。针对这种情况,该如何实现呢?
1 / 2