Designing Large Language Model Applications

作者：	Suhas Pai
语言：	英文
出版年份：	2025
其他分类：	人工智能
下载链接：	PDF 城通网盘书籍均收集自互联网，仅供学习和研究使用，请莫用于商业用途。谢谢合作。

书籍摘要

《Designing Large Language Model Applications》是由Suhas Pai撰写的一本专注于大型语言模型（LLMs）应用设计的实用指南。本书为读者提供了从理论到实践的全方位指导，帮助读者深入理解LLMs的工作原理，并掌握如何将这些强大的工具应用于实际问题中。

作者简介

Suhas Pai是Hudson Labs的联合创始人、首席技术官（CTO）和机器学习研究负责人。他参与了多个开源LLMs的开发，包括BigScience的BLOOM LLM项目，并在隐私工作小组中担任联合领导。凭借其丰富的行业经验和深厚的技术背景，Pai在这本书中分享了他在LLMs领域的宝贵见解和实践经验。

内容概述

本书共分为三个部分，涵盖了LLMs的基础知识、利用LLMs的方法以及LLMs的应用范式。

第一部分：LLMs的基础知识

第1章：介绍
介绍了LLMs的定义、历史背景以及在企业中的应用现状。探讨了LLMs的优势和局限性，并通过一个简单的聊天机器人原型展示了如何开始构建基于LLMs的应用。
第2章：预训练数据
详细讨论了LLMs预训练数据的来源、预处理和清洗方法。分析了数据质量对模型性能的影响，并探讨了如何通过数据混合和去重等技术提高数据质量。
第3章：词汇和分词
解释了LLMs中词汇的定义和构建方法，以及分词算法（如BPE和WordPiece）的工作原理。讨论了如何通过分词技术处理未知词汇（OOV）问题。
第4章：架构和学习目标
深入探讨了Transformer架构的各个组成部分，包括自注意力机制、位置编码、前馈网络和归一化层。分析了不同的学习目标（如全语言建模、掩码语言建模）对模型性能的影响。

第二部分：利用LLMs

第5章：适应你的用例
介绍了如何根据具体任务选择合适的LLMs，包括评估模型性能和选择开源或专有模型的建议。探讨了模型的加载、推理API和解码策略。
第6章：微调
详细介绍了微调的必要性、方法和参数选择。通过一个完整的微调示例，展示了如何针对特定任务优化LLMs。
第7章：高级微调技术
探讨了参数高效微调技术（如LoRA和适配器）、模型合并和模型融合等高级技术。讨论了如何通过这些技术提高微调效率和模型性能。
第8章：对齐训练和推理
定义了对齐训练的概念，并介绍了强化学习等技术如何帮助提高模型的可控性和安全性。探讨了推理时计算的扩展方法，如重复采样和搜索技术。

第三部分：LLMs的应用范式

第10章：与外部工具的交互
讨论了LLMs与外部工具（如API、数据库和代码解释器）的交互方式。介绍了如何通过LangChain等库简化LLMs的集成。
第11章：表示学习和嵌入
探讨了嵌入模型的微调、基模型选择和损失函数设计。讨论了如何通过优化嵌入大小和量化技术提高嵌入效率。
第12章：检索增强生成（RAG）
详细介绍了RAG的原理和应用场景，包括何时进行检索、RAG流程和RAG在内存管理和模型训练中的应用。
第13章：设计模式和系统架构
探讨了多LLM架构、任务专用LLMs和编程范式。介绍了如何通过设计模式和系统架构优化LLMs的应用。

适用人群

本书适合软件工程师、机器学习从业者和产品经理等，旨在帮助读者全面了解LLMs的工作原理，并掌握如何将这些模型应用于实际问题中。无论是初学者还是经验丰富的科学家，都能从本书中获得宝贵的见解和实用的技术指导。

总结

《Designing Large Language Model Applications》是一本全面、实用且富有洞见的书籍，为读者提供了一个从理论到实践的完整框架，帮助他们深入理解和有效利用LLMs。通过丰富的示例和详细的指导，本书不仅帮助读者构建原型，还指导他们如何将这些原型转化为生产级应用。对于任何希望在AI领域取得进展的专业人士来说，这本书都是一个不可或缺的资源。