拆分原理
软件的逻辑是首先获取barcode列表。然后采用多线程分别在fastq文件中并行提取对应barcode的reads。
WGS的下机数据经常出现在fastq2里。所以程序会从fastq中自动查找是否存在对应barcode。
程序可以自动检测barcode始于开始还是末尾,计算hanming距离,运行1bp的mismatch。
众所周知,计算相关性非常的简单,因为R
语言中有函数cor.test()
,该函数可以计算多种方法的相关性检验,返回相关性,Pvalue等检验值,但是这个函数在Julia
中并不存在,让Julia作为一门科学计算语言显得并不完美。
在生物信息学中经常用到的脚本语言主要是python
和perl
,他们被用来处理文本,大量统计,流程控制等等,其自身也是各有优势。比如说perl
天生就为了处理文本而生,但是python
确是有名的胶水语言,特别在整合C
代码时显示出巨大的优势,其语法简洁易懂,易于维护更让其成为仅次于C
和JAVA
的第三大语言,但其糟糕的性能在处理大量循环时会让人忍不住抓狂。因此,Julia
语言应运而生,其控制了python
中没必要的动态性,加之使用JIT技术让其能够保有高性能的同时具备简洁的语法。
2 / 2