Deep Learning for Vision Systems
作者: Mohamed Elgendy
语言: 英文
出版年份: 2020
其他分类: 人工智能
下载链接:
书籍均收集自互联网,仅供学习和研究使用,请莫用于商业用途。谢谢合作。

书籍摘要

《Deep Learning for Vision Systems》是由Mohamed Elgendy撰写的一本专注于计算机视觉领域的深度学习教材,由Manning Publications在2020年出版。本书旨在为读者提供从深度学习基础到高级应用的全面指导,帮助读者掌握构建先进计算机视觉系统的技能。

作者简介

Mohamed Elgendy是Rakuten的工程副总裁,负责领导其AI平台和产品开发。他曾在Synapse Technology担任工程主管,构建用于全球安检点威胁检测的专有计算机视觉应用,并在亚马逊建立了中央AI团队,为AWS和Amazon Go等团队提供深度学习智库。他还开发了亚马逊机器大学的计算机视觉课程。

内容概述

本书分为三部分,涵盖了深度学习的基础知识、图像分类与检测技术,以及生成模型和视觉嵌入等高级主题。

第一部分:深度学习基础

  • 第1章:介绍计算机视觉的基本概念,包括视觉感知、计算机视觉的应用场景(如图像分类、目标检测、风格迁移等)以及计算机视觉处理流程。
  • 第2章:深入探讨神经网络的基础,包括感知器、多层感知器(MLP)、激活函数、前馈过程、误差函数和优化算法等。
  • 第3章:详细讲解卷积神经网络(CNN)的架构和基本组件,如卷积层、池化层和全连接层,并通过项目实践展示如何使用CNN进行图像分类。

第二部分:图像分类与检测

  • 第4章:讨论深度学习项目的结构和超参数调整策略,包括性能指标定义、基线模型设计、数据准备、模型评估和改进。
  • 第5章:介绍高级CNN架构,如LeNet-5、AlexNet、VGGNet、Inception和ResNet,并提供相应的Keras实现。
  • 第6章:探讨迁移学习的概念和方法,包括使用预训练网络作为分类器、特征提取器以及微调技术。
  • 第7章:讲解目标检测技术,包括R-CNN、SSD和YOLO等算法的原理和实现。

第三部分:生成模型和视觉嵌入

  • 第8章:介绍生成对抗网络(GAN)的架构和训练方法,以及如何评估GAN模型。
  • 第9章:探讨深度学习在艺术风格迁移和神经风格转换中的应用。
  • 第10章:讨论视觉嵌入的应用,如人脸识别、图像推荐系统和目标再识别,并介绍学习嵌入的方法和损失函数。

适用对象

本书适合具备机器学习基础知识和Python编程能力的读者,无论是希望在计算机视觉领域就业、深入了解高级神经网络算法,还是希望构建自己的产品或创业的读者,都能从本书中获得宝贵的指导。

特色与优势

  • 全面覆盖:从基础到高级,涵盖计算机视觉领域的核心技术和应用。
  • 实践导向:通过丰富的项目实践,帮助读者将理论知识应用于实际问题。
  • 深度解析:不仅讲解如何使用深度学习模型,还深入探讨模型背后的数学原理。
  • 最新研究:结合最新的研究成果和行业应用,使读者能够紧跟技术前沿。

《Deep Learning for Vision Systems》是一本不可多得的深度学习与计算机视觉领域的专业教材,适合希望在这一领域深入学习和实践的读者。

期待您的支持
捐助本站