基因组数据爆炸式地增长,带来计算上极大的困难,让超级计算机也捉襟见肘。要解决起来,一方面是软件,包括算法的优化和数据压缩技术等;另一方面是硬件,GPU计算、云计算等等。
前一段时间看到华大网站上SOAP系列的软件都了GPU的版本,现在wired出了篇通讯,报道华大用GPU加速基因组数据分析。面向大众的,没有什么专业术语,有兴趣的看看。
Chinese Crunch Human Genome With Videogame Chips
主要讲的是:世界最大基因测序中心华大基因(BGI)和NVIDIA合作将基因分析工具移植到NVIDIA的GPU架构,将基因组分析时间降低一个数量级。以前分析个人的基因组数据需要4天,现在缩短到6小时。
另外:genome research新出一篇论文,说是序列质量比不同拼接软件对拼接结果影响要大。顿时让我联想到种种关于下一代测序技术的论文和报道。下一代测序技术的开发和应用,看似如火如荼,其实非常不成熟,问题很多,还很难用此测序技术做出突破性的新发现。不过,话说回来,不成熟,有问题,很多人都在关注,正好说明了可以做一些东西,且能灌几篇高IF的水文(虽然在科学上不算什么新突破)。