作者: | Geraldine A. Van der Auwera and Brian D. O’Connor |
语言: | 英文 |
出版年份: | 2020 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
《Genomics in the Cloud》是一本由Geraldine A. Van der Auwera和Brian D. O'Connor合著的实用指南,旨在帮助生物医学研究者和生物信息学从业者掌握在云计算环境中进行基因组学分析的方法和工具。本书由O'Reilly Media于2020年出版,是基因组学和云计算领域的重要参考书籍。
随着基因测序技术的飞速发展,基因组学数据量呈爆炸式增长,传统的本地计算资源已难以满足大规模数据分析的需求。云计算的出现为基因组学研究提供了强大的计算支持和数据存储解决方案。本书正是基于这一背景,为读者提供了一条通往基因组学云计算世界的清晰路径。
本书首先为读者提供了基因组学和云计算的基础知识。作者详细介绍了基因组学的基本概念,包括基因、DNA、RNA、蛋白质的结构与功能,以及基因变异的类型和意义。同时,书中也涵盖了云计算的基本概念,如虚拟化技术、容器化技术、并行计算等,为后续的实践操作奠定了坚实的理论基础。
书中重点介绍了基因组学分析中常用的工具和技术,如GATK(Genome Analysis Toolkit)、WDL(Workflow Description Language)、Docker、Google Cloud Platform等。这些工具和技术在基因组学研究中扮演着关键角色,能够帮助研究者高效地处理和分析海量的基因组学数据。
本书的一大特色是提供了丰富的实践操作指导。作者通过一系列详细的步骤,指导读者如何在Google Cloud Platform上搭建基因组学分析环境,如何使用GATK进行变异检测,如何编写和运行WDL工作流,以及如何利用Docker容器化技术确保分析的可重复性。这些实践操作不仅涵盖了单样本分析,还包括了多样本联合分析和肿瘤-正常配对分析等复杂场景。
书中详细介绍了GATK Best Practices,这是一套经过广泛验证的基因组学分析工作流程,能够帮助研究者获得高质量的变异检测结果。作者不仅解释了这些最佳实践的原理和优势,还通过具体的案例展示了如何在实际研究中应用这些工作流程。
作者深入探讨了云计算在基因组学研究中的优势,如弹性计算资源、成本效益、数据共享便利性等。同时,书中也讨论了云计算可能带来的挑战,如数据安全、隐私保护、技术门槛等,并提供了相应的解决方案和建议。
《Genomics in the Cloud》适合以下几类读者:
《Genomics in the Cloud》是一本全面、实用且易于上手的基因组学云计算指南。它不仅涵盖了基因组学和云计算的基础知识,还提供了丰富的实践操作指导和最佳实践案例。通过阅读本书,读者将能够快速掌握在云计算环境中进行基因组学分析的方法和技巧,为未来的生物医学研究和应用打下坚实的基础。