输入是两个字符串,输出是对齐后的两个字符串。
我们在运行bwa mem比对的时候,由于某些不明的原因会造成程序中断,例如内存超了,IO错误,计算节点崩溃等,然而BAM是否完整很难察觉,最终导致后续流程无法运行。这里,我们通过一段简短的代码来检查BAM文件的完整性,代码如下:
如题,官方已经提供了一个R的版本createGCcontentFile.R ,但是根据代码就能看出这个版本非常占内存了,首先要把基因组整个序列都load入内存中去,每次计算出的矫正数据也是储存dataframe中。为了降低内存占用,也为了提高计算速度,我写了一个julia版本的。代码如下:
众所周知,计算相关性非常的简单,因为R
语言中有函数cor.test()
,该函数可以计算多种方法的相关性检验,返回相关性,Pvalue等检验值,但是这个函数在Julia
中并不存在,让Julia作为一门科学计算语言显得并不完美。
1 / 2