LACA
是用于长扩增子一致性分析(例如 16S rRNA 基因扩增子分析)的可重复且可扩展的工作流程。它使用用snakemake
管理工作流程以及conda来
管理环境。
LACA的安装
完整的安装指南LACA
可在此处获取。
您可以根据您的喜好选择使用docker
或从GitHub
存储库安装LACA
Docker镜像
最简单的使用方法是从Docker Hub拉取LACA
镜像以获得跨平台支持
docker pull yanhui09/laca |
LACA
是通过docker
为linux/amd64
平台而构建的,
MacOS
用户需要使用docker容器来运行LACA
。
从 GitHub 存储库安装
1.克隆Github仓库并创建隔离conda
环境
git clone https://github.com/yanhui09/laca.git |
2.安装LACA
为了避免不一致,建议在上面建立的conda
环境中安装LACA
conda activate laca |
使用LACA运行演示数据
在这里找到完整的使用指南。
快速启动示例
laca init -b /path/to/basecalled_fastqs -d /path/to/database # init config file and check |
熟悉LACA
使用
LACA
很容易使用。您可以使用laca init
和laca run
分两步开始新的分析。
如果LACA
安装在conda
环境中,请记住激活conda
环境。
conda activate laca |
要使用 docker 镜像,您需要将数据目录(例如pwd
)挂载到容器中/home
目录。
docker run -it -v `pwd`:/home --privileged yanhui09/laca |
1.初始化配置文件laca init
laca init
会在工作目录中生成一个配置文件,其中包含运行LACA
所需的所有参数。
laca init -h |
2.开始laca run
分析
laca run
将相应地触发完整的工作流程或定义资源下的特定模块。使用laca run -h
获得试运行概述。
laca run -h |
使用演示数据集运行LACA
0.确保您已从此处下载所需的演示数据集。然后cd
进入目录。
例如,输入绝对路径(“长路径”)/home/me/MAC2023-extra
。
cd /home/me/MAC2023-extra |
如果您尚未下载数据用Git
下载,
git clone https://github.com/yanhui09/MAC2023-extra.git |
1.检查您所在的位置并尝试laca init
检查生成的config.yaml
文件。
pwd |
2.LACA
伪运行和真实运行
laca run all -w ./laca_output -n |
LACA
能够生成otu table
,taxonomy table
以及phylogenetic tree
如果您使用laca run all
运行完整的工作流程。但第一次使用需要时间准备数据库和安装。
作为一个例子,这里我们只运行模块kmerCon
来根据 kmer 频率提取一致序列。
看看这些共有序列,取第一个序列对rRNA/ITS
数据库进行BLAST搜索。
head -n2 ./laca_output/kmerCon/kmerCon.fna |
预期输出:
>pooled_0b000_0cand1 |
结果BLAST
表明,该序列是一个16S rRNA
基因片段,Bifidobacterium
一性性超过99%。
读取一个 ONT 并进行相同的
BLAST
搜索。您希望看到什么?
zcat ./data/ont16s/*.fastq.gz | head本文为学习记录,课程作者为:YanHui