分类：编程语言

如何使用 Python 调用 CloudFlare WorkerAI 提供的 Flux 模型

前面的文章打破信息差有提到过，CloudFlare 提供了一些免费的开源模型的 API，而 Flux 的生图模型就在其中。不过，这个模型的 API 最终返回给我们的是 Base64 数据，而不是可直观查看的图片，所以我们需要将图片数据写入文件并上传到云端，然后通过 URL 访问它。另外，我们还希望支持写中文的提示词，所以我们需要在其中增加一个大模型的翻译层，这样就可以把中文的提示词翻译成英文，从而被 Flux 识别。今天，我就通过 Python 代码的方式来实现上述的功能。 🚀

2024-10-24 编程语言

阅读全文

Julia语言编写Needleman Wunsch全局比对算法

输入是两个字符串，输出是对齐后的两个字符串。

2024-09-20 编程语言

阅读全文

Julia语言模仿BAM文件的pileup类似操作

简介

使用过pysam和samtools的小伙伴肯定了解 pileup的操作，如果把BAM文件看作表格的话，那么通常我们是按行去解析它的record，进而获得一些信息，例如比对到哪条染色体，比对的开始位置和结束位置等. 另一种情况下，我们想要按照列去循环解析，得到这个列上的具体信息，典型的就是这个列上比对序列的碱基是什么？比对序列的位置是什么？以及是Match or Mismatch or indel 等。那么，该操作就需要引入pileup操作了。

2024-09-20 编程语言

阅读全文

Python编写拆分Barcode的脚本，并用Codon编译为Native code

摘要

成对的reads中，read_2的开头包含两份barcode序列，分别长10bp,中间有一段固定长度为15bp的序列分割，例如

ATCTATGACATGTTACGTTAACTCCNATCTATCACTTAGCGCTGNCCCTGTCCTCTACACTCCACCCCCTCCCCACCAGACTAAACAACGCCCTTTCCCC

该序列中ATTTATGACA及AATCTATCAA为barcode序列。要注意，barcode因为测序的原因存在一定的错配，需要对其有一定的容纳。

2024-09-20 编程语言

阅读全文

不同的语言处理gzip压缩文件的时间对比

首先在shell中测试如下命令

#!/bin/sh
time gzip -d -c risearch_chr1:143971112-143971134:+:FAM72C.out.gz > risearch_chr1:143971112-143971134:+:FAM72C.out

2024-09-20 编程语言

阅读全文

使用R语言实现bedtools求交集的功能?

Bedtools作为基因组研究的 “ 瑞士军刀 ”，功能强大且易于操作，是生信行业不可多得的好软件。通常对bed区间的注释，我们使用其中“ 求交集 ”的功能（bedtools intersect) ，但是有一个很不方便的地方，我们通常要生成对应的bed文件，再注释完成后还需要用R语言等读入才能继续分析，所以整合度不是很好，本文希望提供R语言的思路来解决该问题。

2024-09-20 编程语言

阅读全文