《Time Series Forecasting in Python》是一本由Marco Peixeiro撰写的专注于时间序列预测的实用指南。本书旨在帮助数据科学家掌握Python中时间序列预测的核心概念和技术,内容涵盖了从基础统计模型到深度学习模型的广泛应用,适合有一定Python基础的数据科学从业者。
书籍结构
本书分为四个部分,共21章,内容由浅入深,逐步引导读者掌握时间序列预测的关键技能。
第一部分:时间序列预测基础
- 第1章:介绍时间序列的基本概念,包括其定义、组成部分(趋势、季节性和残差)以及时间序列预测与其他回归任务的区别。
- 第2章:通过简单的基线模型(如历史均值、上一时间点值等)开始预测实践,为后续复杂模型提供基准。
- 第3章:探讨随机游走模型,解释在何种情况下时间序列预测可能无效,以及如何识别和处理随机游走过程。
第二部分:统计模型预测
- 第4章:介绍移动平均模型(MA(q)),解释如何通过自相关函数(ACF)识别模型阶数并进行预测。
- 第5章:讲解自回归模型(AR(p)),包括如何使用偏自相关函数(PACF)确定模型阶数。
- 第6章:结合AR(p)和MA(q)模型,形成ARMA(p,q)模型,并介绍一般建模流程,包括模型选择和残差分析。
- 第7章:扩展ARMA模型,引入差分操作,形成ARIMA(p,d,q)模型,用于非平稳时间序列的预测。
- 第8章:进一步引入季节性因素,构建SARIMA(p,d,q)(P,D,Q)m模型,用于具有季节性模式的时间序列预测。
- 第9章:介绍SARIMAX模型,允许在预测中加入外部变量,提升模型的预测能力。
- 第10章:探讨向量自回归(VAR)模型,用于同时预测多个相关时间序列。
第三部分:深度学习预测
- 第12章:介绍深度学习在时间序列预测中的应用,包括数据窗口化和基线模型的构建。
- 第13章:通过简单线性模型和深度神经网络(DNN)开始深度学习模型的实现。
- 第14章:探索长短期记忆网络(LSTM),利用其记忆功能处理时间序列数据。
- 第15章:结合卷积神经网络(CNN)和LSTM,利用CNN的特征提取能力提升预测性能。
- 第16章:介绍自回归LSTM模型,通过将模型输出反馈作为输入,实现更精准的预测。
第四部分:大规模预测自动化
- 第19章:介绍Prophet自动化预测库,通过实际案例展示其在时间序列预测中的应用。
- 第20章:通过案例对比Prophet和SARIMAX模型的性能,探讨自动化预测工具的优势。
- 第21章:总结全书内容,鼓励读者探索时间序列数据的更多应用。
书籍特色
- 实用性强:书中结合大量实际案例,通过Python代码实现,帮助读者快速上手。
- 覆盖面广:从基础统计模型到深度学习模型,再到自动化预测工具,内容丰富全面。
- 易于理解:作者采用循序渐进的方式,逐步引导读者掌握复杂概念,适合初学者和有一定基础的读者。
适用人群
- 数据科学家:希望提升时间序列预测技能的专业人士。
- 数据分析师:需要处理时间序列数据并进行预测的从业者。
- 机器学习工程师:对时间序列预测感兴趣的深度学习和机器学习爱好者。
《Time Series Forecasting in Python》是一本全面、实用且易于上手的时间序列预测指南,适合任何希望在Python中掌握时间序列预测技术的读者。