《大数据架构详解:从数据获取到深度学习.pdf》PDF高清完整版-免费下载

Python publisher01 44℃

《大数据架构详解:从数据获取到深度学习.pdf》PDF高清完整版-免费下载

下载地址:

百度网盘下载   提取码:79s0

百度网盘下载   提取码:8i63

本书从架构、业务、技术三个维度深入浅出地介绍了大数据处理领域端到端的知识。主要内容包括三部分:第一部分从数据的产生、采集、计算、存储、消费端到端的角度介绍大数据技术的起源、发展、关键技术点和未来趋势,结合生动的业界新产品,以及学术界新的研究方向和成果,让深奥的技术浅显易懂;第二部分从业务和技术角度介绍实际案例,让读者理解大数据的用途及技术的本质;第三部分介绍大数据技术不是孤立的,讲解如何与前沿的云技术、深度学习、机器学习等相结合。

作者简介

朱洁,2008年加入华为,具有8年大数据研发管理经验,现任华为大数据服务首席规划师。专注于大数据服务平台建设、规划和实践应用,同时参与多项企业级大数据项目解决方案的规划、设计和实施工作,在深化大数据行业落地方面有诸多实践经验,对解读大数据垂直行业的技术创新与开发有诸多独到的见解和心得。

罗华霖,2002年加入华为,华为大数据首席规划师,主导完成华为大数据平台DataSight和华为电信大数据解决方案SmartCare技术规划和架构设计,支持电信运营商数字化战略转型,完成浙江移动、上海联通、沙特STC等200+电信大数据解决方案项目落地。曾任华为软交换首席设计师,华为大型电信大数据解决方案SmartCare首席架构师。

目录

第一部分 大数据的本质

第1章 大数据是什么 2

1.1 大数据导论 2

1.1.1 大数据简史 2

1.1.2 大数据现状 3

1.1.3 大数据与BI 3

1.2 企业数据资产 4

1.3 大数据挑战 5

1.3.1 成本挑战 6

1.3.2 实时性挑战 6

1.3.3 安全挑战 6

1.4 小结 6

第2章 运营商大数据架构 7

2.1 架构驱动的因素 7

2.2 大数据平台架构 7

2.3 平台发展趋势 8

2.4 小结 8

第3章 运营商大数据业务 9

3.1 运营商常见的大数据业务 9

3.1.1 SQM(运维质量管理) 9

3.1.2 CSE(客户体验提升) 9

3.1.3 MSS(市场运维支撑) 10

3.1.4 DMP(数据管理平台) 10

3.2 小结 11

第二部分 大数据技术

第4章 数据获取 14

4.1 数据分类 14

4.2 数据获取组件 14

4.3 探针 15

4.3.1 探针原理 15

4.3.2 探针的关键能力 16

4.4 网页采集 26

4.4.1 网络爬虫 26

4.4.2 简单爬虫Python代码示例 32

4.5 日志收集 33

4.5.1 Flume 33

4.5.2 其他日志收集组件 47

4.6 数据分发中间件 47

4.6.1 数据分发中间件的作用 47

4.6.2 Kafka架构和原理 47

4.7 小结 82

第5章 流处理 83

5.1 算子 83

5.2 流的概念 83

5.3 流的应用场景 84

5.3.1 金融领域 84

5.3.2 电信领域 85

5.4 业界两种典型的流引擎 85

5.4.1 Storm 85

5.4.2 Spark Streaming 89

5.4.3 融合框架 102

5.5 CEP 108

5.5.1 CEP是什么 108

5.5.2 CEP的架构 109

5.5.3 Esper 110

5.6 实时结合机器学习 110

5.6.1 Eagle的特点 111

5.6.2 Eagle概览 111

5.7 小结 116

第6章 交互式分析 117

6.1 交互式分析的概念 117

6.2 MPP DB技术 118

6.2.1 MPP的概念 118

6.2.2 典型的MPP数据库 121

6.2.3 MPP DB调优实战 131

6.2.4 MPP DB适用场景 162

6.3 SQL on Hadoop 163

6.3.1 Hive 163

6.3.2 Phoenix 165

6.3.3 Impala 166

6.4 大数据仓库 167

6.4.1 数据仓库的概念 167

6.4.2 OLTP/OLAP对比 168

6.4.3 大数据场景下的同与不同 168

6.4.4 查询引擎 169

6.4.5 存储引擎 170

6.5 小结 171

转载请注明:Python量化投资 » 《大数据架构详解:从数据获取到深度学习.pdf》PDF高清完整版-免费下载

喜欢 (0)or分享 (0)