抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

拆分原理

  • 软件的逻辑是首先获取barcode列表。然后采用多线程分别在fastq文件中并行提取对应barcode的reads。

  • WGS的下机数据经常出现在fastq2里。所以程序会从fastq中自动查找是否存在对应barcode。

  • 程序可以自动检测barcode始于开始还是末尾,计算hanming距离,运行1bp的mismatch。

众所周知,计算相关性非常的简单,因为R 语言中有函数cor.test(),该函数可以计算多种方法的相关性检验,返回相关性,Pvalue等检验值,但是这个函数在Julia中并不存在,让Julia作为一门科学计算语言显得并不完美。

前言

自己写的好几种算法企图实现bedtools的功能,虽然julia性能足够好,但都难以在效率上达到bedtools的性能,于是最后只能借助轮子了。

如何安装Julia

有很多方法,其中最简单的就是去各大景象站点下载编译好的二进制包,例如

另外,可以使用包管理工具jill下载安装,

在生物信息学中经常用到的脚本语言主要是pythonperl,他们被用来处理文本大量统计流程控制等等,其自身也是各有优势。比如说perl天生就为了处理文本而生,但是python确是有名的胶水语言,特别在整合C代码时显示出巨大的优势,其语法简洁易懂,易于维护更让其成为仅次于CJAVA的第三大语言,但其糟糕的性能在处理大量循环时会让人忍不住抓狂。因此,Julia语言应运而生,其控制了python中没必要的动态性,加之使用JIT技术让其能够保有高性能的同时具备简洁的语法。