前面的文章打破信息差有提到过,CloudFlare 提供了一些免费的开源模型的 API,而 Flux 的生图模型就在其中。不过,这个模型的 API 最终返回给我们的是 Base64 数据,而不是可直观查看的图片,所以我们需要将图片数据写入文件并上传到云端,然后通过 URL 访问它。另外,我们还希望支持写中文的提示词,所以我们需要在其中增加一个大模型的翻译层,这样就可以把中文的提示词翻译成英文,从而被 Flux 识别。今天,我就通过 Python 代码的方式来实现上述的功能。 🚀
前面的文章打破信息差有提到过,CloudFlare 提供了一些免费的开源模型的 API,而 Flux 的生图模型就在其中。不过,这个模型的 API 最终返回给我们的是 Base64 数据,而不是可直观查看的图片,所以我们需要将图片数据写入文件并上传到云端,然后通过 URL 访问它。另外,我们还希望支持写中文的提示词,所以我们需要在其中增加一个大模型的翻译层,这样就可以把中文的提示词翻译成英文,从而被 Flux 识别。今天,我就通过 Python 代码的方式来实现上述的功能。 🚀
Bedtools作为基因组研究的 “ 瑞士军刀 ”, 功能强大且易于操作,是生信行业不可多得的好软件。通常对bed区间的注释,我们使用其中“ 求交集 ”的功能(bedtools intersect) ,但是有一个很不方便的地方,我们通常要生成对应的bed文件,再注释完成后还需要用R语言等读入才能继续分析,所以整合度不是很好,本文希望提供R语言的思路来解决该问题。
我们在运行bwa mem比对的时候,由于某些不明的原因会造成程序中断,例如内存超了,IO错误,计算节点崩溃等,然而BAM是否完整很难察觉,最终导致后续流程无法运行。这里,我们通过一段简短的代码来检查BAM文件的完整性,代码如下:
如题,官方已经提供了一个R的版本createGCcontentFile.R ,但是根据代码就能看出这个版本非常占内存了,首先要把基因组整个序列都load入内存中去,每次计算出的矫正数据也是储存dataframe中。为了降低内存占用,也为了提高计算速度,我写了一个julia版本的。代码如下:
1 / 2