kindle电子书

资源下载,尽在我的书库!
首页 > kindle电子书库 > 典藏频道 > 工农林医、科学科普、IT网络

Python大战机器学习:数据科学家的第一个小目标

  • 作者: 多作者
  • 体积:67.96 MB
  • 语言:中文
  • 日期:2018-03-01
  • 推荐:

简介:本书以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python编程实践,采用"原理笔记精华+算法Python实现+问题实例+实际代码+运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。

电子书详细介绍

 《Python大战机器学习:数据科学家的第一个小目标》内容提要 数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。 Python 是热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的首选语言。 《Python大战机器学习:数据科学家的第一个小目标》以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python 编程实践,采用“原理笔记精华+ 算法Python 实现+ 问题实例+ 代码实战+ 运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。 《Python大战机器学习:数据科学家的第一个小目标》从内容上分为13 章分4 篇展开:第一篇:机器学习基础篇(第1~6 章),讲述机器学习的基础算法,包括线性模型、决策树、贝叶斯分类、k 近邻法、数据降维、聚类和EM算法;第二篇:机器学习高级篇(第7~10 章),讲述经典而常用的高级机器学习算法,包括支持向量机、人工神经网络、半监督学习和集成学习;第三篇:机器学习工程篇(第11~12章),讲述机器学习工程中的实际技术,包括数据预处理,模型评估、选择与验证等;第四篇:Kaggle 实战篇(第13 章),讲述一个Kaggle 竞赛题目的实战。 《Python大战机器学习:数据科学家的第一个小目标》内容丰富、深入浅出,算法与代码双管齐下,无论你是新手还是有经验的读者,都能快速学到你想要的知识。本书可供为高等院校计算机、金融、信息、自动化及相关理工科专业的本科生或研究生使用,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。

编辑推荐

本书编辑推荐
时下热门职业是数据科学家,而不是传统的信息科学家,也不是大数据工程师。
数据科学家必备的技能中,机器学习和Python 应该是位列前五的两项,学习本书,实现自己的首个小目标。

作者简介

华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。

 

目录

第一篇机器学习基础篇1
第1章线性模型2
1.1概述2
1.2算法笔记精华2
1.2.1普通线性回归2
1.2.2广义线性模型5
1.2.3逻辑回归5
1.2.4线性判别分析7
1.3Python实战10
1.3.1线性回归模型11
1.3.2线性回归模型的正则化12
1.3.3逻辑回归22
1.3.4线性判别分析26
第2章决策树30
2.1概述30
2.2算法笔记精华30
2.2.1决策树原理30
2.2.2构建决策树的3个步骤31
2.2.3CART算法37
2.2.4连续值和缺失值的处理42
2.3Python实战43
2.3.1回归决策树(DecisionTreeRegressor)43
2.3.2分类决策树(DecisionTreeClassifier)49
2.3.3决策图54
第3章贝叶斯分类器55
3.1概述55
3.2算法笔记精华55
3.2.1贝叶斯定理55
3.2.2朴素贝叶斯法56
3.3Python实战59
3.3.1高斯贝叶斯分类器(GaussianNB)61
3.3.2多项式贝叶斯分类器(MultinomialNB)62
3.3.3伯努利贝叶斯分类器(BernoulliNB)65
3.3.4递增式学习partial_fit方法69
第4章k近邻法70
4.1概述70
4.2算法笔记精华70
4.2.1kNN三要素70
4.2.2k近邻算法72
4.2.3kd树73
4.3Python实践74
第5章数据降维83
5.1概述83
5.2算法笔记精华83
5.2.1维度灾难与降维83
5.2.2主成分分析(PCA)84
5.2.3SVD降维91
5.2.4核化线性(KPCA)降维91
5.2.5流形学习降维93
5.2.6多维缩放(MDS)降维93
5.2.7等度量映射(Isomap)降维96
5.2.8局部线性嵌入(LLE)97
5.3Python实战99
5.4小结118
第6章聚类和EM算法119
6.1概述119
6.2算法笔记精华120
6.2.1聚类的有效性指标120
6.2.2距离度量122
6.2.3原型聚类123
6.2.4密度聚类126
6.2.5层次聚类127
6.2.6EM算法128
6.2.7实际中的聚类要求136
6.3Python实战137
6.3.1K均值聚类(KMeans)138
6.3.2密度聚类(DBSCAN)143
6.3.3层次聚类(AgglomerativeClustering)146
6.3.4混合高斯(GaussianMixture)模型149
6.4小结153
第二篇机器学习高级篇155
第7章支持向量机156
7.1概述156
7.2算法笔记精华157
7.2.1线性可分支持向量机157
7.2.2线性支持向量机162
7.2.3非线性支持向量机166
7.2.4支持向量回归167
7.2.5SVM的优缺点170
7.3Python实战170
7.3.1线性分类SVM171
7.3.2非线性分类SVM175
7.3.3线性回归SVR182
7.3.4非线性回归SVR186
第8章人工神经网络192
8.1概述192
8.2算法笔记精华192
8.2.1感知机模型192
8.2.2感知机学习算法194
8.2.3神经网络197
8.3Python实战205
8.3.1感知机学习算法的原始形式205
8.3.2感知机学习算法的对偶形式209
8.3.3学习率与收敛速度212
8.3.4感知机与线性不可分数据集213
8.3.5多层神经网络215
8.3.6多层神经网络与线性不可分数据集216
8.3.7多层神经网络的应用219
第9章半监督学习225
9.1概述225
9.2算法笔记精华226
9.2.1生成式半监督学习方法226
9.2.2图半监督学习228
9.3Python实战234
9.4小结243
第10章集成学习244
10.1概述244
10.2算法笔记精华244
10.2.1集成学习的原理及误差244
10.2.2Boosting算法246
10.2.3AdaBoost算法246
10.2.4AdaBoost与加法模型252
10.2.5提升树253
10.2.6Bagging算法256
10.2.7误差—分歧分解257
10.2.8多样性增强259
10.3Python实战260
10.3.1AdaBoost261
10.3.2Gradient Tree Boosting272
10.3.3Random Forest288
10.4小结298
……
第三篇机器学习工程篇299
第四篇Kaggle实战篇401
全书符号436

我来说两句

本书评论

共有 0 条评论
图书分类
我的书库手机端
帮助中心
会员登录 ×
新用户注册 ×