一种突如其来的新型冠状病毒(新冠肺炎)触动了全世界的神经,抗击疫情成为各界广泛关注的焦点。其实除了一直在前线作战的医护人员,先进的科技力量是这场战争的另一个关键战线。在新型冠状病毒的研究工作中,研究人员需要首先分析病毒的全基因组序列,然后根据序列开发相应的诊断试剂盒,并分析病毒同源性,找到病毒的来源,同时根据病毒的信息和特征,决定下一步的预防和治疗方法。
目前,高通量测序技术被广泛用于获得更完整和详细的病毒基因组序列。但是,由于病毒基因组测序会产生大量的tb级甚至pb级的数据,这种技术产生的dna序列数据量非常大,需要强大的计算能力来支持。因此,高性能计算在有效管理、分析和利用这些串行数据方面发挥着重要作用。俄勒冈州立大学基因组研究与生物计算中心(cgrb)作为国际知名的基因研究机构之一,利用基于amd epyc处理器的高性能计算设备,积极探索基因测序,无疑值得借鉴。
多线程带来高效率,让科研更进一步
俄勒冈州立大学基因组研究和生物计算中心(cgrb)为该大学的26个系提供服务,从而促进基因组和数据驱动的研究。研究人员可以使用该中心开发的4000到5000个程序,这些程序运行在分布式服务架构上,该架构有5000多个处理器、5 pb的可用存储空间和安全的专用1g/10g/40g网络。Cgrb每天都会产生4tb到8tb的海量数据,而且一直有成千上万的作业在运行。因此,如何进一步提高高性能计算水平,增加运算次数,帮助高校以最佳性价比进行科研,是目前亟待解决的问题。
cgrb生物计算助理主任克里斯·沙利文(Chris sullivan)说:我们每天处理大约20,000项任务,其中大部分与基因组比对有关。可能有一百个作业同时运行,每个作业包含5000万个必须与基因组进行比较的序列,每个作业使用不同的算法。处理如此巨大的数据需要一台高性能的服务器,该服务器具有许多处理器内核和线程。
经过一系列的评估和比较,amd epyc处理器已经成为俄勒冈州立大学的选择。我们的研究成果取决于线程的数量。我们需要回答科学问题,但是处理器频率不改变科学答案,所以我们不会为了更高的处理器频率花更多的钱。然而,线程越多,我们完成的工作就越多,这意味着我们可以离答案更近一步。因此,我们一直在寻找非常高的线程数量,希望达到100个以上,同时具有高性价比。Sullivan说,就我们说的线程数和作业数来说,只有amd epyc真正符合这个要求,可以提供128个线程。
事实上,通过增加更多基于amd epyc的高性能计算设备,cgrb可以以更低的总运营成本获得更多线程,从而完成更多工作,提高投资回报。
降低成本,提高效率0/室,使科研更容易
amd epyc拥有的内核密度和线程数在其他方面也发挥着重要作用。我不能扩大我的服务器机房,这将花费数百万美元。然而epyc处理器给了我一个新的选择。沙利文认为,epyc处理器的双向配置回报显著。我们插上电源,拿到需要的线程,足够快的完成工作,不需要对服务器机房做任何改造。
此外,俄勒冈州立大学的研究团队还降低了cgrb的管理成本,将可执行的操作数量增加了一倍。沙利文解释说:有了amd epyc,我们就不再使用infiniband了。它们可以本机运行,比使用infiniband更快。在amd epyc的帮助下,该中心不仅降低了管理开销,还降低了成本。同时在不影响性能的情况下,用更具性价比的设备代替笨拙的大型机器,赢得了研究者的一致好评。
cgcb正在寻找的新技术要求研究人员更快地获得计算结果。这项技术说服了研究人员,他们是采购的决策者。Amd epyc正是他们想要的,因为它在价格和线程数量上有很大的优势。所以我们申请资助是很容易的。沙利文提到。
科学研究永无止境,计算能力从未停止
沙利文说,对于俄勒冈州立大学的各种科研项目,现有的计算能力远远不够,科学的发展正在逐渐超越设备的能力。面对不断增长的计算需求,cgrb将继续与amd合作,部署新一代高性能计算,获得更前沿、更强大的计算体验。
我们的研究小组正准备用更多内核和线程的amd epyc处理器取代现有的48线程和24核处理器。沙利文表示,amd将成为推动该中心科学不断发展的重要力量。Amd一直在帮助我们,我们期待着部署更多的amd epyc,因为更多的线程意味着更好的成本效益。
毫无疑问,强有力的计算支持对于当前新冠肺炎疫情中的应用以及疫情爆发后的科学研究和检测都是不可或缺的。amd epyc以其卓越的性能、易用性和领先的总体拥有成本优势,为企业和研究机构提供了一条持续分析和创新的捷径。
标题:[科技界] AMD EPYC以超多核心超强 “算力”助推基因研究
地址:http://www.heliu2.cn/xw/5785.html