kindle电子书

资源下载,尽在我的书库!
首页 > kindle电子书库 > 典藏频道 > 工农林医、科学科普、IT网络

scikit-learn机器学习:常用算法原理及编程实战

  • 作者:[中] 黄永昌
  • 体积:9.32 MB
  • 语言:中文
  • 日期:2018-08-16
  • 推荐:

简介:本书通过通俗易懂的语言、丰富的图示和生动的实例,拨开了笼罩在机器学习上方复杂的数学“乌云”,让读者以较低的代价和门槛轻松入门机器学习。

电子书详细介绍

 《scikit learn机器学习:常用算法原理及编程实战》通过通俗易懂的语言、丰富的图示和生动的实例,拨开了笼罩在机器学习上方复杂的数学“乌云”,让读者以较低的代价和门槛入门机器学习。《scikit learn机器学习:常用算法原理及编程实战》共分为11章,介绍了在Python环境下学习scikit—learn机器学习框架的相关知识,涵盖的主要内容有机器学习概述、Python机器学习软件包、机器学习理论基础、k—近邻算法、线性回归算法、逻辑回归算法、决策树、支持向量机、朴素贝叶斯算法、PCA算法和k—均值算法等。

编辑推荐

《scikit learn机器学习:常用算法原理及编程实战》适合有一定编程基础的读者阅读,尤其适合想从事机器学习、人工智能、深度学习及机器人相关技术的程序员和爱好者阅读。另外,相关院校和培训机构也可以将《scikit learn机器学习:常用算法原理及编程实战》作为教材使用。

名人推荐

机器学习方面的国书已经出版了多本,但要找一本写得通俗易瞳,容易入门的却有点难。而本书恰恰就是一本这样的书,非常值得推荐给入门读者阅读。书中介绍了常见的机器学习算法,并给出了多个实例,不但可以让读者理解相关算法的原理,而且还可以在作者的引领下动手实践。
——孙言东,阿里云栖社区技术专家
当前,人工智能是一个热门话题,这使得驱动其发展的机器学习和深度学习等技术也变得炙手可热。而学习这些技术的门槛不低,有相当的难度。可喜的是,本书将这个门槛大大地降低了,读者不会一上来就被一大堆数学公式和推导过程折磨,非常值得一读。
——刘凡,百度(中国)有限公司高级研发工程师
特征是对现实世界的抽象,算法是对内嵌逻辑的还原,这个过程的量化是机器学习要解决的问题。这虽然是个有趣的领域,但却像哲学遇到数学后的化学反应一样,难以窥其堂奥。你有两种选择,一种是从头做起,先研习数理后看算法,最后再和应用场景建立关联;另一种是由果而因,直接了解不同模型对于不同场景的存在意义,再有针对性地深入探究其背后的数学原理。相信后者事半功倍,但前提是你需要有一个先能抽丝剥茧地梳理线索,而后能通俗易懂地讲故事的好帮手。这就是我看这本书的价值所在,不仅由浅入深,环环相扣,可贵之处更在于经典案例在不同章节中穿插展现,在不同模型下对比分析,前后关联,循循善诱,不仅是一本初学者入门的读物,而且也是业内朋友随身携带的工具好书。
——陈源,蒙牛乳业数据分析总监
机器学习是近年的技术热点,市场空间非常大,但其学习门槛不低。由于计算机是一门实践学科,没有真正实现运行,则很难理解算法的精髓。而这本书正好满足了这两个特点:用深入浅出的讲解帮助初学者学习理论知识;用大量有益的实例带领读者实践,并检验学习效果。无论是机器学习的入门人员,还是有一定基础的进阶者,均能从本书中有所获益。
——戴剑,神州数码云计算有限公司技术总监
本书作者给读者贡献了一本通俗易懂的机器学习入门图书。你只需要具备基本的Python编程知识即可阅读本书。读完本书,虽然不能保证你能获得kaggle竞赛奖金,但完全可以保证你能轻松地参加kaggle竞赛,而且不出意外会排在前30%的名次内。如果你是一名程序员,又对机器学习感兴趣,那么本书非常值得你阅读。
——刘京华,Polycom资深程序员/IT畅销书作者
这是一本有趣的书。L1范数和L2范数作为正则项,为什么对模型参数有不同的影响?熟悉闽南地区中秋博饼规则的读者,有没有好奇博出状元和对堂的概率是多少?连续多次通过骰子赌大小,最终输赢在额度上有什么规律?本书对这些问题的探讨,让我想起了吴军老师的《数学之美》一书。一本技术图书要写得有趣很不容易,但本书做到了,值得各位读者阅读。
——郑捷,threedweb创始人/机器学习畅销书作者

作者简介

黄永昌,2004年毕业于厦门大学自动化系。毕业后一直在夏新电子从事手机系统软件的研发,直至2009年转向Android系统软件开发。熟悉C、Python、Java和JavaScript等多种开发语言。对数据处理及分析有浓厚的兴趣,于2014年开始学习和研究机器学习及数据挖掘领域的相关知识。2015年加入ABB集团,从事智能家居系统的开发,通过分析服务器及客户端日志数据,为智能家居系统开发智能决策模型。

 

目录

前言
第1章 机器学习介绍1
1.1 什么是机器学习1
1.2 机器学习有什么用2
1.3 机器学习的分类3
1.4 机器学习应用开发的典型步骤4
1.4.1 数据采集和标记4
1.4.2 数据清洗5
1.4.3 特征选择5
1.4.4 模型选择5
1.4.5 模型训练和测试5
1.4.6 模型性能评估和优化5
1.4.7 模型使用6
1.5 复习题6
第2章 Python机器学习软件包7
2.1 开发环境搭建7
2.2 IPython简介8
2.2.1 IPython基础8
2.2.2 IPython图形界面13
2.3 Numpy简介15
2.3.1 Numpy数组15
2.3.2 Numpy运算19
2.4 Pandas简介32
2.4.1 基本数据结构32
2.4.2 数据排序34
2.4.3 数据访问34
2.4.4 时间序列36
2.4.5 数据可视化36
2.4.6 文件读写38
2.5 Matplotlib简介38
2.5.1 图形样式38
2.5.2 图形对象40
2.5.3 画图操作46
2.6 scikit—learn简介51
2.6.1 scikit—learn示例51
2.6.2 scikit—learn一般性原理和通用规则55
2.7 复习题56
2.8 拓展学习资源57
第3章 机器学习理论基础58
3.1 过拟合和欠拟合58
3.2 成本函数59
3.3 模型准确性60
3.3.1 模型性能的不同表述方式61
3.3.2 交叉验证数据集61
3.4 学习曲线62
3.4.1 实例:画出学习曲线62
3.4.2 过拟合和欠拟合的特征65
3.5 算法模型性能优化65
3.6 查准率和召回率66
3.7 F1 Score67
3.8 复习题67
第4章 k—近邻算法69
4.1 算法原理69
4.1.1 算法优缺点69
4.1.2 算法参数70
4.1.3 算法的变种70
4.2 示例:使用k—近邻算法进行分类70
4.3 示例:使用k—近邻算法进行回归拟合72
4.4 实例:糖尿病预测74
4.4.1 加载数据74
4.4.2 模型比较75
4.4.3 模型训练及分析77
4.4.4 特征选择及数据可视化78
4.5 拓展阅读80
4.5.1 如何提高k—近邻算法的运算效率80
4.5.2 相关性测试80
4.6 复习题81
第5章 线性回归算法83
5.1 算法原理83
5.1.1 预测函数83
5.1.2 成本函数84
5.1.3 梯度下降算法84
5.2 多变量线性回归算法86
5.2.1 预测函数86
5.2.2 成本函数87
5.2.3 梯度下降算法88
5.3 模型优化89
5.3.1 多项式与线性回归89
5.3.2 数据归一化89
5.4 示例:使用线性回归算法拟合正弦函数90
5.5 示例:测算房价92
5.5.1 输入特征92
5.5.2 模型训练93
5.5.3 模型优化94
5.5.4 学习曲线95
5.6 拓展阅读96
5.6.1 梯度下降迭代公式推导96
5.6.2 随机梯度下降算法96
5.6.3 标准方程97
5.7 复习题97
第6章 逻辑回归算法98
6.1 算法原理98
6.1.1 预测函数98
6.1.2 判定边界99
6.1.3 成本函数100
6.1.4 梯度下降算法102
6.2 多元分类102
6.3 正则化103
6.3.1 线性回归模型正则化103
6.3.2 逻辑回归模型正则化104
6.4 算法参数104
6.5 实例:乳腺癌检测106
6.5.1 数据采集及特征提取106
6.5.2 模型训练108
6.5.3 模型优化110
6.5.4 学习曲线111
6.6 拓展阅读113
6.7 复习题114
第7章 决策树115
7.1 算法原理115
7.1.1 信息增益116
7.1.2 决策树的创建119
7.1.3 剪枝算法120
7.2 算法参数121
7.3 实例:预测泰坦尼克号幸存者122
7.3.1 数据分析122
7.3.2 模型训练123
7.3.3 优化模型参数124
7.3.4 模型参数选择工具包127
7.4 拓展阅读130
7.4.1 熵和条件熵130
7.4.2 决策树的构建算法130
7.5 集合算法131
7.5.1 自助聚合算法Bagging131
7.5.2 正向激励算法boosting131
7.5.3 随机森林132
7.5.4 ExtraTrees算法133
7.6 复习题133
第8章 支持向量机134
8.1 算法原理134
8.1.1 大间距分类算法134
8.1.2 松弛系数136
8.2 核函数138
8.2.1 最简单的核函数138
8.2.2 相似性函数140
8.2.3 常用的核函数141
8.2.4 核函数的对比142
8.3 scikit—learn里的SVM144
8.4 实例:乳腺癌检测146
8.5 复习题149
……
第9章 朴素贝叶斯算法151
第10章 PCA算法168
第11章 k—均值算法190
后记205

我来说两句

本书评论

共有 0 条评论
图书分类
我的书库手机端
帮助中心
会员登录 ×
新用户注册 ×