kindle电子书

资源下载,尽在我的书库!
首页 > kindle电子书库 > 典藏频道 > 工农林医、科学科普、IT网络

机器学习实战:基于Scikit-Learn和TensorFlow

简介:机器学习实战:基于Scikit-Learn和TensorFlow (O’Reilly精品图书系列)

电子书详细介绍

 本书主要分为两个部分。部分为第1章到第8章,涵盖机器学习的基础理论知识和基本算法——从线性回归到随机森林等,帮助读者掌握Scikit-Learn的常用方法;第二部分为第9章到第16章,探讨深度学习和常用框架TensorFlow,一步一个脚印地带领读者使用TensorFlow搭建和训练深度神经网络,以及卷积神经网络。

编辑推荐

本书作者曾经是谷歌工程师,在2013年至2016年主导了YouTube的视频分类工程,拥有丰富的机器学习项目经验。本书从开发者的实践角度,在动手写代码的过程中,循序渐进地了解机器学习的理论知识和工具的实践技巧,可以帮助读者快速上手机器学习项目。

作者简介

随着一系列的突破,深度学习点燃了整个机器学习领域。 现在,即使是对这项技术毫无基础的程序员,也可以使用简单高效的工具来实现“可以自动从数据中学习”的程序。本书将展示如何做到这一点。 

通过具体的例子、非常少的理论和两个产品级的Python框架——Scikit-learn 和 TensorFlow 。作者帮助你很直观地理解并掌握构建智能系统的概念和工具。你将学习一系列技术,从简单的线性回归开始到深度神经网络等。每章都有习题来帮助你应用学到的知识,你所需要的只是一点编程经验,仅此而已。 

- 探索机器学习的全景图,特别是神经网络。 
- 使用Scikit-Learn来端到端地建立一个机器学习项目的示例。 
- 探索多种训练模型,包括支持向量机、决策树、随机森林和集成方法。 
- 使用TensorFlow库建立和训练神经网络。 
- 深入神经网络架构,包括卷积网络、递归网络和深度强化学习。 
- 学习训练和伸缩深度神经网络的技巧。 
- 应用可以工作的代码示例,而无须过多的机器学习理论或算法细节。 

本书是关于使用神经网络来解决问题的理论和实践的一本导论。它涵盖了你建立高效应用的关键点,以及足够的背景知识以应对新研究的出现。 我推荐这本书给有兴趣学习用机器学习来解决实际问题的人。 

- Pete Warden 
- TensorFlow移动端负责人 


Aurelien Geron是机器学习方面的顾问。他是Google的前员工,在2013年到2016年领导过YouTube视频分类团队。2002年至2012年,他还是Wifirst公司的创始人和技术官,在2001年,他是Ployconseil公司的创始人和技术官。 

目录

目录 
前言1 
第一部分 机器学习基础 
第1章 机器学习概览11 
什么是机器学习12 
为什么要使用机器学习12 
机器学习系统的种类15 
监督式/无监督式学习16 
批量学习和在线学习21 
基于实例与基于模型的学习24 
机器学习的主要挑战29 
训练数据的数量不足29 
训练数据不具代表性30 
质量差的数据32 
无关特征32 
训练数据过度拟合33 
训练数据拟合不足34 
退后一步35 
测试与验证35 
练习37 
第2章 端到端的机器学习项目39 
使用真实数据39 
观察大局40 
框架问题41 
选择性能指标42 
检查假设45 
获取数据45 
创建工作区45 
下载数据48 
快速查看数据结构49 
创建测试集52 
从数据探索和可视化中获得洞见56 
将地理数据可视化57 
寻找相关性59 
试验不同属性的组合61 
机器学习算法的数据准备62 
数据清理63 
处理文本和分类属性65 
自定义转换器67 
特征缩放68 
转换流水线68 
选择和训练模型70 
培训和评估训练集70 
使用交叉验证来更好地进行评估72 
微调模型74 
网格搜索74 
随机搜索76 
集成方法76 
……
通过测试集评估系统77 
启动、监控和维护系统78 
试试看79 
练习79 
第3章 分类80 
MNIST80 
训练一个二元分类器82 
性能考核83 
使用交叉验证测量精度83 
混淆矩阵84 
精度和召回率86 
精度/召回率权衡87 
ROC曲线90 
多类别分类器93 
错误分析95 
多标签分类98 
多输出分类99 
练习100 
第4章 训练模型102 
线性回归103 
标准方程104 
计算复杂度106 
梯度下降107 
批量梯度下降110 
随机梯度下降112 
小批量梯度下降114 
多项式回归115 
学习曲线117 
正则线性模型121 
岭回归121 
套索回归123 
弹性网络125 
早期停止法126 
逻辑回归127 
概率估算127 
训练和成本函数128 
决策边界129 
Softmax回归131 
练习134 
第5章 支持向量机136 
线性SVM分类136 
软间隔分类137 
非线性SVM分类139 
多项式核140 
添加相似特征141 
高斯RBF核函数142 
计算复杂度143 
SVM回归144 
工作原理145 
决策函数和预测146 
训练目标146 
二次规划148 
对偶问题149 
核化SVM149 
在线SVM151 
练习152 
第6章 决策树154 
决策树训练和可视化154 
做出预测155 
估算类别概率157 
CART训练算法158 
计算复杂度158 
基尼不纯度还是信息熵159 
正则化超参数159 
回归161 
不稳定性162 
练习163 
第7章 集成学习和随机森林165 
投票分类器165 
bagging和pasting168 
Scikit-Learn的bagging和pasting169 
包外评估170 
Random Patches和随机子空间171 
随机森林172 
极端随机树173 
特征重要性173 
提升法174 
AdaBoost175 
梯度提升177 
堆叠法181 
练习184 
第8章 降维185 
维度的诅咒186 
数据降维的主要方法187 
投影187 
流形学习189 
PCA190 
保留差异性190 
主成分191 
低维度投影192 
使用Scikit-Learn192 
方差解释率193 
选择正确数量的维度193 
PCA压缩194 
增量PCA195 
随机PCA195 
核主成分分析196 
选择核函数和调整超参数197 
局部线性嵌入199 
其他降维技巧200 
练习201 
第二部分 神经网络和深度学习 
第9章 运行TensorFlow205 
安装207 
创建一个计算图并在会话中执行208 
管理图209 
节点值的生命周期210 
TensorFlow中的线性回归211 
实现梯度下降211 
手工计算梯度212 
使用自动微分212 
使用优化器214 
给训练算法提供数据214 
保存和恢复模型215 
用TensorBoard来可视化图和训练曲线216 
命名作用域219 
模块化220 
共享变量222 
练习225 
第10章 人工神经网络简介227 
从生物神经元到人工神经元227 
生物神经元228 
具有神经元的逻辑计算229 
感知器230 
多层感知器和反向传播233 
用TensorFlow的高级API来训练MLP236 
使用纯TensorFlow训练DNN237 
构建阶段237 
执行阶段240 
使用神经网络241 
微调神经网络的超参数242 
隐藏层的个数242 
每个隐藏层中的神经元数243 
激活函数243 
练习244 
第11章 训练深度神经网络245 
梯度消失/爆炸问题245 
Xavier初始化和He初始化246 
非饱和激活函数248 
批量归一化250 
梯度剪裁254 
重用预训练图层255 
重用TensorFlow模型255 
重用其他框架的模型256 
冻结低层257 
缓存冻结层257 
调整、丢弃或替换高层258 
模型动物园258 
无监督的预训练259 
辅助任务中的预训练260 
快速优化器261 
Momentum优化261 
Nesterov梯度加速262 
AdaGrad263 
RMSProp265 
Adam优化265 
学习速率调度267 
通过正则化避免过度拟合269 
提前停止269 
1和2正则化269 
dropout270 
最大范数正则化273 
数据扩充274 
实用指南275 
练习276 
第12章 跨设备和服务器的分布式TensorFlow279 
一台机器上的多个运算资源280 
安装280 
管理GPU RAM282 
在设备上操作284 
并行执行287 
控制依赖288 
多设备跨多服务器288 
开启一个会话290 
master和worker服务290 
分配跨任务操作291 
跨多参数服务器分片变量291 
用资源容器跨会话共享状态292 
使用TensorFlow队列进行异步通信294 
直接从图中加载数据299 
在TensorFlow集群上并行化神经网络305 
一台设备一个神经网络305 
图内与图间复制306 
模型并行化308 
数据并行化309 
练习314 
第13章 卷积神经网络31

我来说两句

本书评论

共有 0 条评论
图书分类
我的书库手机端
帮助中心
会员登录 ×
新用户注册 ×