作者: | Zonunfeli Ralte and Indrajit Kar |
语言: | 英文 |
出版年份: | 2024 |
编程语言: | Python |
其他分类: | 人工智能 |
下载链接: |
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。 |
本书由 Zonunfeli Ralte 和 Indrajit Kar 共同撰写,由 BPB Publications 在 2024 年出版,是一本全面深入地介绍生成式人工智能(Generative AI)的书籍,涵盖了从自编码器(autoencoders)到变换器(transformers)再到大型语言模型(Large Language Models,LLMs)的演变历程。
Zonunfeli Ralte 拥有商业管理和经济学硕士学位,拥有 15 年的分析、金融和人工智能(AI)经验,是 RastrAI 的创始人兼首席执行官,同时担任首席人工智能顾问。她在生成式人工智能(GenAI)应用开发方面有着丰富的经验,并在 IEEE 发表了 6 篇关于大型语言模型、深度学习和计算机视觉的研究论文,其中 3 篇获得了最佳论文奖,还拥有 1 项 GenAI 专利。 Indrajit Kar 拥有班加罗尔的计算生物学硕士学位,以及同一机构的科学学士学位,拥有超过 20 年的人工智能和机器学习(ML)经验。他曾在西门子、埃森哲、IBM 和 Infinite Data Systems 等公司担任 AI 团队的领导职务,目前是人工智能和机器学习的副总裁兼全球负责人,领导人工智能研究(ZAIR)和数据实践。他在 IEEE、Springers、Wiley Online Library 和 CRC Press 等顶级期刊上发表了 22 篇关于 LLM、计算机视觉、自然语言处理(NLP)等主题的研究论文,拥有 14 项专利,包括生成式人工智能,还获得了多个奖项,包括 40 岁以下数据科学家奖,并且是两本 AI 书籍的作者。
本书共分为 13 章,内容涵盖了生成式人工智能的基础理论、模型架构、训练方法以及在多个领域的应用案例。
本章介绍了生成式人工智能的概念、发展历史以及与判别式模型的区别。详细讨论了生成式模型的类型、优缺点,并通过实际案例展示了其在数据不平衡场景中的应用。
深入探讨了 GANs 的架构、类型以及训练过程中的关键问题。介绍了多种 GANs 变体,如 Vanilla GAN、Deep Convolutional GAN、Wasserstein GAN 等,并讨论了它们的设计因素和应用场景。
本章聚焦于 GANs 的训练技巧,包括如何解决模式坍塌、梯度消失、训练不稳定等问题。通过实际案例展示了 GANs 在数据增强和类别平衡中的应用。
介绍了自编码器的基本原理、架构以及在生成式任务中的应用。讨论了正则化技术在自编码器中的重要性,并通过 CIFAR-10 数据集展示了自编码器的实现和应用。
深入探讨了自编码器的潜在空间、双输入自编码器以及损失函数的选择。讨论了训练过程中可能出现的问题及其解决方案,并比较了自编码器和变分自编码器(VAEs)的优缺点。
本章详细介绍了 VAEs 的网络架构、数学原理以及与传统自编码器的区别。讨论了 VAEs 在处理缺失数据和不完整数据方面的优势,并展示了如何通过 VAEs 生成新的数据样本。
进一步探讨了 VAEs 的架构选择、KL 散度的影响以及在不同数据模态下的应用。讨论了如何处理训练过程中的常见问题,并优化 VAEs 的性能。
介绍了变换器(Transformers)的基本概念、架构以及在自然语言处理和计算机视觉中的应用。详细讨论了自注意力机制、多头注意力以及位置编码等关键技术。
本章通过 STL 数据集展示了如何从 VAEs 转换到生成式变换器模型。比较了生成式变换器和传统变换器在架构和训练方法上的区别,并探讨了它们在图像生成任务中的应用。
探讨了如何将编码器 - 解码器架构与变换器模型相结合,以提高生成式建模的性能。介绍了 SWIN 变换器的实现,并讨论了超参数调整和模型重构的重要性。
本章讨论了生成式人工智能在数据表示、检索和跨模态理解方面面临的挑战。介绍了向量数据库和图像嵌入技术在解决这些问题中的应用。
通过多个行业案例展示了生成式人工智能在医疗保健、零售、金融和保险等领域的应用。讨论了生成式人工智能如何改变这些行业的业务流程和客户服务。
本章总结了前 12 章的核心内容,提炼了关键概念和重要知识点。为读者提供了对生成式人工智能的全面理解,并为未来的研究和应用提供了指导。
本书不仅涵盖了生成式人工智能的基础理论和模型架构,还提供了大量的实际案例和代码实现,帮助读者更好地理解和应用这些技术。书中还讨论了生成式人工智能在多个领域的应用,展示了其在解决实际问题中的潜力和价值。此外,本书还提供了丰富的学习资源,包括代码库、彩色图像以及与作者的互动机会,为读者的学习和研究提供了便利。
本书适合对生成式人工智能感兴趣的读者,包括数据科学家、机器学习工程师、研究人员以及相关领域的学生。无论你是初学者还是有一定基础的专业人士,都能从本书中获得有价值的见解和知识。