商品详情

89.80

《数据浪潮:大数据技术演进之路》

数量

商品详情

【产品特色】

【编辑推荐】

1.内容新颖,结构合理

本书结合大数据和数据库系统,从技术历史的角度介绍数据管理系统的发展,既有系统架构的演进,又有商业产品的兴衰,适合不同的读者。



2.案例丰富,深入浅出

本书有针对性地介绍了如Oracle、IBM、Google等公司数据库和大数据产品的迭代,也介绍了关于Spark、MySQL、TiDB等主流系统的架构设计,同时有对分布式算法、一致性算法等的讲解。从公司、产品、技术、人物等角度列举了诸多实例。



3.配套资源,优化学习

读者可到异步社区网站下载与本书配套的彩图,方便读者提升学习效果





【内容简介】

近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。

本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、发展和商业应用,数据库与大数据之间的关系,国产数据库的国际化,数据管理系统的共同之处,数据管理系统的算法理论、前沿技术等。

本书适合数据管理系统或大数据方向的技术人员和科研人员阅读,也适合互联网科技公司的技术人员及管理人员,以及对特定领域的商业和历史感兴趣的读者阅读。

【目录】

第 1篇 数据管理系统之数据库——掌上明珠



第 1章 数据库的诞生——“图灵”奖经典人物 3

1.1 网状数据管理系统 4

1.2 关系数据库模型 6

1.3 数据库并发与事务 8

1.4 数据库优化与实践 10

1.5 小结 13

1.6 参考资料 13

第 2章 数据库的工业繁荣——商业机遇 14

2.1 System R 14

2.2 PostgreSQL 16

2.3 Oracle 18

2.4 MySQL 20

2.5 IBM Db2 23

2.6 SQL Server 27

2.7 小结 29

2.8 参考资料 30

第3章 国产数据库的热潮——四大家族 31

3.1 人大金仓 31

3.2 南大通用 32

3.3 武汉达梦 32

3.4 神舟通用 33

3.5 小结 34

3.6 参考资料 35



第 2篇 数据管理系统之大数据——异军突起



第4章 大数据降临——生逢其时 39

4.1 Google的“三驾马车” 39

4.1.1 GFS 40

4.1.2 MapReduce系统 41

4.1.3 Bigtable系统 42

4.2 Amazon的“云上时代” 43

4.3 Facebook的“社交帝国” 44

4.4 LinkedIn的“职业摇篮” 46

4.5 学术界的徘徊辗转 48

4.6 小结 49

4.7 参考资料 49

第5章 大数据分布式系统——高潮迭起 50

5.1 容错内存迭代式计算 50

5.2 实时流式大数据计算 52

5.2.1 Storm系统 52

5.2.2 Flink系统 53

5.3 大规模机器学习系统 54

5.4 数据中心的资源管理 56

5.5 全球分布式数据服务 58

5.6 小结 59

5.7 参考资料 59

第6章 开源整合架构演进——融会贯通 60

6.1 链家架构演进 60

6.1.1 大数据平台架构演进 60

6.1.2 日志平台设计与技术 61

6.2 美团架构演进 62

6.2.1 由浅入深架构解析 62

6.2.2 基础系统架构演进 64

6.3 Airbnb架构演进 65

6.3.1 大数据平台架构解析 65

6.3.2 平台发展的经验和教训 66

6.4 58同城架构演进 68

6.4.1 大数据三层平台架构 68

6.4.2 关键技术演进与实现 70

6.5 滴滴出行架构演进 71

6.5.1 实时计算平台架构演进 71

6.5.2 实时计算平台架构 72

6.6 小米架构演进 73

6.6.1 流式平台整体架构 73

6.6.2 3个阶段的演进历程 74

6.7 小结 77

6.8 参考资料 77

第7章 大数据的魅力——广泛应用 78

7.1 工业应用 78

7.2 银行金融 79

7.3 智慧城市 81

7.4 健康医疗 82

7.5 小结 83

7.6 参考资料 84



第3篇 大数据管理系统——谁主沉浮



第8章 数据库与大数据之战——华山论剑 87

8.1 ACM双方论战 87

8.2 MPP绝对优势 89

8.3 大数据强势发展 91

8.4 数据库自我革命 94

8.5 NewSQL兼容并包 96

8.6 老牌数据库的反击 99

8.7 小结 101

8.8 参考资料 102

第9章 大数据管理系统——求同存异 103

9.1 Hadoop生态 104

9.2 BDAS平台 105

9.3 AsterixDB系统 106

9.4 Apache Beam框架 108

9.5 SnappyData模型 109

9.6 SageDB愿景 110

9.7 ShardingSphere项目 112

9.8 小结 114

9.9 参考资料 115

第 10章 新型数据管理系统——百花齐放 116

10.1 大数据输入和输出 116

10.2 大数据调度管控 119

10.3 大数据用户交互 123

10.4 大数据安全隐私 124

10.5 大数据新型引擎 127

10.6 大数据通用语言 129

10.7 大数据网络赋能 130

10.8 小结 134

10.9 参考资料 135

第 11章 国产数据库的国际化——齐头并进 137

11.1 TiDB 137

11.1.1 研发背景 137

11.1.2 早期架构 138

11.1.3 架构升级 139

11.1.4 稳定架构 140

11.2 OceanBase 142

11.2.1 设计考量 142

11.2.2 架构演进 144

11.2.3 厚积薄发 150

11.3 TDSQL 150

11.3.1 分布式TDSQL 150

11.3.2 分析型TBase 152

11.3.3 云原生CynosDB 153

11.3.4 产品战略统一 154

11.4 GaussDB 155

11.4.1 OLTP成长史 155

11.4.2 OLAP成长史 156

11.4.3 HTAP成长史 157

11.4.4 AI-Native成长史 157

11.5 Bigflow 158

11.6 ByteGraph 160

11.7 小结 163

11.8 参考资料 164



第4篇 大数据管理系统的架构——路在何方



第 12章 高速电子计算机与大数据管理系统——万法归宗 167

12.1 以计算为中心的计算机 167

12.2 以存储为中心的数据机 170

12.3 大数据管理的系统模型 172

12.4 数据管理系统的总结抽象 176

12.5 小结 178

12.6 参考资料 179

第 13章 无处不在的操作系统——归纳演绎 180

13.1 计算机的操作系统 180

13.2 数据管理系统的操作系统 184

13.3 数据中心的操作系统 185

13.4 资源抽象与应用接口 189

13.5 小结 192

13.6 参考资料 192

第 14章 大数据管理系统的未来架构——沙漠绿洲 194

14.1 大数据操作系统 195

14.1.1 数据输入 197

14.1.2 数据存储 198

14.1.3 数据计算 200

14.1.4 数据控制 201

14.1.5 数据输出 202

14.2 自动化可插拔引擎 203

14.3 分布式弹性数据模型 203

14.4 易用抽象作业执行框架 204

14.5 深度智能系统管理内核 204

14.6 大数据管理系统biggy原型 204

14.7 小结 205

14.8 参考资料 206



第5篇 大数据管理系统的精髓——无上心法



第 15章 大数据管理系统的基础——算法理论 209

15.1 存储类算法 209

15.1.1 大数据LSM的优势 209

15.1.2 B -Tree与LSM-Tree对比 210

15.1.3 LSM的优化算法 211

15.2 执行器算法 212

15.2.1 Spark RDD中DAG的应用 212

15.2.2 分布式数据库的算子运算 213

15.2.3 大数据DAG与数据库算子的异同 214

15.3 一致性算法 214

15.3.1 常见一致性算法简介 214

15.3.2 Paxos算法进阶深入 215

15.3.3 一致性的Consensus与Consistency 216

15.4 持久化算法 218

15.4.1 经典的WAL 218

15.4.2 前沿的WBL 219

15.5 分布式算法 220

15.5.1 分布式P2P协议 220

15.5.2 一致性哈希算法 220

15.6 事务类算法 222

15.6.1 两阶段提交 222

15.6.2 三阶段提交 223

15.7 分布式容错机制 224

15.7.1 分布式系统容错机制 225

15.7.2 数据库系统容错机制 227

15.7.3 工业实践与学术创新 227

15.8 高并发控制机制 229

15.8.1 并发控制类别 229

15.8.2 并发控制实现 230

15.9 系统健壮性机制 232

15.10 小结 234

15.11 参考资料 234

第 16章 大数据管理系统的前沿——另辟蹊径 236

16.1 数据上下文管理系统Ground 236

16.2 自治数据管理系统Peloton 239

16.3 分布式预测系统Clipper 240

16.4 数据管理中人的作用CrowdDB 241

16.5 新硬件带来的变革doppioDB 242

16.6 端云协同实时数据库Firebase 243

16.7 自组装数据库XuanYuan 245

16.8 数据治理新思路Tamr 248

16.9 系统性能调优AITuning 249

16.10 小结 253

16.11 参考资料 253

第 17章 大数据管理系统的谜团——拨云见日 255

17.1 分布式机器学习与分布式数据库 255

17.2 分布式一致性与数据库一致性 257

17.3 可变的数据与不可变的数据 260

17.4 区块链与数据库的异同 261

17.5 NewSQL与OldSQL 263

17.6 云计算、边缘计算与物联网 266

17.7 大数据Java还是C/C 270

17.8 流数据与批处理的界线 270

17.9 分布式事务与递增式时间 272

17.10 小结 273

17.11 参考资料 274

第 18章 大数据的标准——游戏规则 275

18.1 TPC标准测试 275

18.2 SQL通用语言 277

18.3 顶级学术会议 277

18.4 设计范式 279

18.5 流行趋势 281

18.6 研究机构 283

18.7 小结 284

18.8 参考资料 284

附录 285

A.工业与学术 285

B.国产与国际 286

C.开放与封闭 288

D.资本与技术 292

E.个人与企业 295

F.过去与未来 299

G.参考资料 300



【作者简介】

吴垚,毕业于中国人民大学,是中国人民大学和加利福尼亚大学尔湾分校(UCI)联合培养的博士,目前就职于华为公司加拿大研究院。其国内导师陈红是CCF数据库专委委员,国家科技进步二等奖获得者;国外导师Michael J. Carey是美国工程院院士、ACM和IEEE Fellow。博士在读期间作者参与的项目包括:物联网搜索中的隐私保护研究、新一代高时效安全可靠流数据系统、“Big Active Data:From Petabyte Data to Million People”等。毕业后就职于华为高斯部门,先后在高斯产品部、高斯实验室和多伦多实验室工作,在GaussDB、XY Kernel、HP Kernel等项目中参与AP数据库、AI数据库、TP数据库的研发。

【媒体评论】

本书介绍了广义概念上的数据管理系统的重要发展节点以及技术变革,带领读者从数据库走进大数据。书中涵盖了重要的技术变革事件、关键技术介绍以及对主流系统的架构介绍,涉及前技术趋势和未来的发展方向,既能帮助入门者了解数据管理系统的发展历程,也可以帮助从业者拓展视野,了解前沿趋势。

——李国良,清华大学教授



近年来,国内数据管理系统领域的市场规模已达到百亿元,风投机构、技术精英纷纷进入该行业,我们迎来了国产数据库的春天。在本书中,作者从科研和产业的双重视角展开介绍,既总结了数据管理系统的发展历史

相关产品推荐

服务参数

- 本商品享受上述商家服务 - 关闭

商品参数

×