《深度实践Spark机器学习(吴茂贵)》高清中文版PDF免费下载

《深度实践Spark机器学习(吴茂贵)》高清中文版PDF免费下载

下载链接:

百度网盘下载提取码:sjqa

百度网盘下载提取码:w88h

本书系统讲解了Spark机器学习的技术、原理、组件、算法,以及构建Spark机器学习系统的方法、流程、标准和规范。此外,还介绍了Spark的深度学习框架TensorFlowOnSpark,以及如何借助它实现卷积神经网络和循环神经网络。

全书共14章,分为四个部分:

第一部分(1~7章)

主要讲解了Spark机器学习的技术、原理和核心组件,包括Spark ML、Spark ML Pipeline、Spark MLlib,以及如何构建一个Spark机器学习系统。

第二部分(8~12章)

主要以实例为主,讲解了Spark ML的各种机器学习算法,包括推荐模型、分类模型、聚类模型、回归模型,以及PySpark决策树模型和Spark R朴素贝叶斯模型。

第三部(第13章)

与之前的批量处理不同,本章以在线数据或流式数据为主,讲解了Spark的流式计算框架Spark Streaming。

第四部分(第14章)

介绍了Spark深度学习,主要包括TensorFlow的基础知识及它与Spark的整合框架TensorFlowOnSpark。

目录

目  录?Contents

前言

第1章 了解机器学习 1

1.1 机器学习的定义 1

1.2 大数据与机器学习 2

1.3 机器学习、人工智能及深度学习 2

1.4 机器学习的基本任务 3

1.5 如何选择合适算法 4

1.6 Spark在机器学习方面的优势 5

1.7 小结 5

第2章 构建Spark机器学习系统 6

2.1 机器学习系统架构 6

2.2 启动集群 7

2.3 加载数据 9

2.4 探索数据 10

2.4.1 数据统计信息 10

2.4.2 数据质量分析 11

2.4.3 数据特征分析 12

2.4.4 数据的可视化 17

2.5 数据预处理 19

2.5.1 数据清理 20

2.5.2 数据变换 21

2.5.3 数据集成 22

2.5.4 数据归约 23

2.6 构建模型 25

2.7 模型评估 26

2.8 组装 30

2.9 模型选择或调优 30

2.9.1 交叉验证 31

2.9.2 训练–验证切分 32

2.10 保存模型 32

2.11 小结 33

第3章 ML Pipeline原理与实战 34

3.1 Pipeline简介 34

3.2 DataFrame 35

3.3 Pipeline组件 36

3.4 Pipeline原理 37

3.5 Pipeline实例 38

3.5.1 使用Estimator、Transformer和Param的实例 38

3.5.2 ML使用Pipeline的实例 40

3.6 小结 41

第4章 特征提取、转换和选择 42

4.1 特征提取 42

4.1.1 词频—逆向文件

频率(TF-IDF) 42

4.1.2 Word2Vec 43

4.1.3 计数向量器 44

4.2 特征转换 45

4.2.1 分词器 45

4.2.2 移除停用词 46

4.2.3 n-gram 47

4.2.4 二值化 48

4.2.5 主成分分析 48

4.2.6 多项式展开 50

4.2.7 离散余弦变换 50

4.2.8 字符串—索引变换 51

4.2.9  索引—字符串变换 53

4.2.10 独热编码 54

4.2.11 向量—索引变换 57

4.2.12 交互式 58

4.2.13 正则化 59

4.2.14 规范化 60

4.2.15 最大值—最小值缩放 60

4.2.16 最大值—绝对值缩放 61

4.2.17 离散化重组 62

4.2.18 元素乘积 63

4.2.19 SQL转换器 64

4.2.20 向量汇编 65

4.2.21 分位数离散化 66

4.3 特征选择 67

4.3.1 向量机 67

4.3.2 R公式 69

4.3.3 卡方特征选择 70

4.4 小结 71

第5章 模型选择和优化 72

作者:歌琪怡玲萍云

链接:https://www.jianshu.com/p/26c4d57b3b62

来源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

你或许想:《去原作者写文章的地方

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论