XiaoHanys

16S rRNA基因扩增子分析

在此工作流程中，介绍了 Qiime2 和 R 中 16S rRNA 基因扩增子数据分析的主要步骤。本教程是为哥本哈根大学食品科学系的 MAC 2023 课程准备的。尽管这些步骤是为 Oxford Nanopore Tech (ONT) 测序设计的，但也在 Ilumina 短读长上进行了测试。

2024-09-20 生物信息

去源站阅读

用VueJS和Fastapi通过websocket实现进度条追踪

简介

在我们的应用小程序中，我们是前后端分离的。前端页面只负责渲染，而后端需要处理数据。但是如果遇到数据量很大的情况下，我们处理起来就很缓慢，如果我们想通过AJAX的方法追踪后台数据变化的进度，需要用到轮询的方案，这个是非常消耗资源的。这里我们用VueJS和Fastapi的小例子演示前端传递数据，后台用10秒处理数据并实时反应进度给前台的实现。

2024-09-20 网站搭建

阅读全文

生信小白如何用vuejs简单创建一个交互式网页

什么是Vue.js

VueJS是一个渐进式的前端框架，所谓渐进式的意思就是你可以用它快速完成原型创作，然后在此基础上逐步完善。他可以足够简单，也可以足够完善，那么对于新手小白来说，这简直就是福利！

2024-09-20 网站搭建

阅读全文

把Fastapi部署到免费的Deta Space上

上一篇文章我们写了一个Streamlit的程序来全栈的执行我们的任务，但是我们也看到了它的一个缺点：前端界面非异步，UI定制缺乏灵活性。那么，我们接下来尝试采用前后端分离的方式来完成上次的任务。

2024-09-20 网站搭建

阅读全文

Julia语言编写Needleman Wunsch全局比对算法

输入是两个字符串，输出是对齐后的两个字符串。

2024-09-20 编程语言

阅读全文

使用过pysam和samtools的小伙伴肯定了解 pileup的操作，如果把BAM文件看作表格的话，那么通常我们是按行去解析它的record，进而获得一些信息，例如比对到哪条染色体，比对的开始位置和结束位置等. 另一种情况下，我们想要按照列去循环解析，得到这个列上的具体信息，典型的就是这个列上比对序列的碱基是什么？比对序列的位置是什么？以及是Match or Mismatch or indel 等。那么，该操作就需要引入pileup操作了。

2024-09-20 编程语言

阅读全文

Python编写拆分Barcode的脚本，并用Codon编译为Native code

摘要

成对的reads中，read_2的开头包含两份barcode序列，分别长10bp,中间有一段固定长度为15bp的序列分割，例如

ATCTATGACATGTTACGTTAACTCCNATCTATCACTTAGCGCTGNCCCTGTCCTCTACACTCCACCCCCTCCCCACCAGACTAAACAACGCCCTTTCCCC

该序列中ATTTATGACA及AATCTATCAA为barcode序列。要注意，barcode因为测序的原因存在一定的错配，需要对其有一定的容纳。

2024-09-20 编程语言

阅读全文

单细胞数据如何绘制stacked violin?

Python的Scanpy包和Seurat包一样，是单细胞数据处理的利器，其中，Scanpy中有一种堆积的小提琴图，可以很好的展示marker的表达情况，但是在Seurat中并没有内置命令。因此，我自己尝试提取数据并用ggplot2包来画该图。

首先来展示以下画图的成果，如图

2024-09-20 生物信息

阅读全文

不同的语言处理gzip压缩文件的时间对比

首先在shell中测试如下命令

#!/bin/sh
time gzip -d -c risearch_chr1:143971112-143971134:+:FAM72C.out.gz > risearch_chr1:143971112-143971134:+:FAM72C.out

2024-09-20 编程语言

阅读全文

使用R语言实现bedtools求交集的功能?

Bedtools作为基因组研究的 “ 瑞士军刀 ”，功能强大且易于操作，是生信行业不可多得的好软件。通常对bed区间的注释，我们使用其中“ 求交集 ”的功能（bedtools intersect) ，但是有一个很不方便的地方，我们通常要生成对应的bed文件，再注释完成后还需要用R语言等读入才能继续分析，所以整合度不是很好，本文希望提供R语言的思路来解决该问题。

2024-09-20 编程语言

阅读全文