kindle电子书

资源下载,尽在我的书库!
首页 > kindle电子书库 > 工业|计算机|互联网 > 电子、计算机、网络

Greenplum企业应用实战 (数据库技术丛书 2)

  • 作者: 多作者
  • 体积:11.06 MB
  • 语言:中文
  • 日期:2017-06-08
  • 推荐:

简介:《Greenplum企业应用实战》一共15章,分为三个部分:基础篇(第1~3章)首先介绍了Greenplum的应用场景、功能特性以及与PostgreSQL的关系,然后讲解了Greenplum的安装配置、语法以及相关操作,最后通过两个具体的数据仓库ETL案例加强读者对Greenplum的功能特性的了解和操作能力;进阶篇(第4~7章)围绕数据字典、执行计划、系统架构、高级特性等主题对Greenplum进行了更深入地讲解,不仅能让读者更深入理解Greenplum的工作原理,也能让读者游刃有余地应对各种日常操作;管理篇(8~15章)从运维和管理的角度讲解了Greenplum的线上部署、数据库管理、脚本维护、监控、权限控制、容灾/扩容、备份恢复、性能调优、常用技巧和常见问题等。

电子书详细介绍

 本书从实战角度出发,结合了大量实践案例(附有详细的代码),由浅入深介绍了Greenplum。本书由15章组成,主要分为3篇。 
上篇(第1~3章)——基础篇 
基础篇目的是帮助读者快速了解Greenplum,从实战的角度介绍一些入门必备的基础知识。从如何安装部署Greenplum开始,一步步引导读者搭建自己的Greenplum数据库,然后介绍基本的语法及相关操作。本篇最后通过分析两个具体的数据仓库ETL的案例,加强读者对Greenplum功能特性的了解,提高实践能力。 
中篇(第4~7章)——进阶篇 
进阶篇重点介绍Greenplum的数据字典、执行计划、架构以及一些高级特性。 
数据字典是Greenplum对元数据信息的组织方式,执行计划是数据库执行SQL的灵魂,高级特性则是Greenplum的优势所在。本篇结合了大量案例对以上内容进行了深入分析。通过对这些内容的学习,可以深入理解数据库的工作原理,是进阶的必经之路,可以让读者游刃有余地应对各种Greenplum的日常操作。 
下篇(第8~15章)——管理篇 
管理篇主要介绍一些与数据库管理员相关的知识,包括线上部署、性能优化、权限控制、监控、容灾/扩容方案、常用脚本以及常见问题等。这些更偏向于后台管理,是DBA必修的课程。

编辑推荐

《Greenplum企业应用实战》是国内首本Greenplum著作,国内最早开始使用Greenplum的企业是阿里巴巴,《Greenplum企业应用实战》的两位作者是阿里巴巴最早负责使用和维护Greenplum的技术工程师,权威性毋庸置疑。《Greenplum企业应用实战》完全立足于阿里巴巴的企业应用实践,不仅系统介绍Greenplum的功能特性、使用方法、高级应用,而且还详细讲解Greenplum的系统架构、运维管理、性能优化和各种技巧。最重要的是,包含大量企业级应用案例,每个案例都进行了详尽的讲解和实操指导。

目录

上篇 基 础 篇 
第1章 Greenplum简介 
1.1 Greenplum的起源和发展历程 
1.2 OLTP与OLAP 
1.3 PostgreSQL与Greenplum的关系 
1.3.1 PostgreSQL 
1.3.2 Greenplum 
1.4 Greenplum特性及应用场景 
1.4.1 Greenplum特性 
1.4.2 Greenplum应用场景 
1.5 小结 
第2章 Greenplum快速入门 
2.1 软件安装及数据库初始化 
2.1.1 Greenplum架构 
2.1.2 环境搭建 
2.1.3 Greenplum安装 
2.1.4 创建数据库 
2.1.5 数据库启动与关闭 
2.2 安装Greenplum的常见问题 
2.2.1 /etc/hosts配置错误 
2.2.2 MASTER_DATA_DIRECTORY设置错误 
2.3 畅游Greenplum 
2.3.1 如何访问Greenplum 
2.3.2 数据库整体概况 
2.3.3 基本语法介绍 
2.3.4 常用数据类型 
2.3.5 常用函数 
2.3.6 分析函数 
2.3.7 分区表 
2.3.8 外部表 
2.3.9 COPY命令 
2.4 小结 
第3章 Greenplum实战 
3.1 历史拉链表 
3.1.1 应用场景描述 
3.1.2 原理及步骤 
3.1.3 表结构 
3.1.4 Demo数据准备 
3.1.5 数据加载 
3.1.6 数据刷新 
3.1.7 分区裁剪 
3.1.8 数据导出 
3.2 日志分析 
3.2.1 应用场景描述 
3.2.2 数据Demo 
3.2.3 日志分析实战 
3.3 数据分布 
3.3.1 数据分散情况查看 
3.3.2 数据加载速度影响 
3.3.3 数据查询速度影响 
3.4 数据压缩 
3.4.1 数据加载速度影响 
3.4.2 数据查询速度影响 
3.5 索引 
3.6 小结 
中篇 进 阶 篇 
第4章 数据字典详解 
4.1 oid无处不在 
4.2 数据库集群信息 
4.2.1 Gp_configuration和gp_segment_configuration 
4.2.2 Gp_id 
4.2.3 Gp_configuration_history 
4.2.4 pg_filespace_entry 
4.2.5 集群配置信息表转化 
4.3 常用数据字典 
4.3.1 pg_class 
4.3.2 pg_attribute 
4.3.3 gp_distribution_policy 
4.3.4 pg_statistic和pg_stats 
4.4 分区表信息 
4.4.1 如何实现分区表 
4.4.2 pg_partition 
4.4.3 pg_partition_rule 
4.4.4 pg_partitions视图及其优化 
4.5 自定义类型以及类型转换 
4.6 主、备节点同步的相关数据字典 
4.7 数据字典应用示例 
4.7.1 获取表的字段信息 
4.7.2 获取表的分布键 
4.7.3 获取一个视图的定义 
4.7.4 查询comment(备注信息) 
4.7.5 获取数据库建表语句 
4.7.6 查询表上的视图 
4.7.7 查询表的数据文件创建时间 
4.7.8 分区表总大小 
4.7.9 如何分析数据字典变化 
4.7.10 获取数据库锁信息 
4.8 Gp_toolkit介绍 
4.9 小结 
第5章 执行计划详解 
5.1 执行计划入门 
5.1.1 什么是执行计划 
5.1.2 查看执行计划 
5.2 分布式执行计划概述 
5.2.1 架构 
5.2.2 重分布与广播 
5.2.3 Greenplum Master的工作 
5.3 Greenplum执行计划中的术语 
5.3.1 数据扫描方式 
5.3.2 分布式执行 
5.3.3 两种聚合方式 
5.3.4 关联 
5.3.5 SQL消耗 
5.3.6 其他术语 
5.4 数据库统计信息收集 
5.4.1 Analyze分析 
5.4.2 固定执行计划 
5.5 控制执行计划的参数介绍 
5.6 规划器开销的计算方法 
5.7 各种执行计划原理分析 
5.7.1 详解关联的广播与重分布 
5.7.2 HashAggregate与GroupAggregate 
5.7.3 Nestloop Join 、 Hash Join 与Merge Join 
5.7.4 分析函数:开窗函数和grouping sets 
5.8 案例 
5.8.1 关联键强制类型转换,导致重分布 
5.8.2 统计信息过期 
5.8.3 执行计划出错 
5.8.4 分布键选择不恰当 
5.8.5 计算distinct 
5.8.6 union与union all 
5.8.7 子查询not in 
5.8.8 聚合函数太多导致内存不足 
5.9 小结 
第6章 Greenplum高级应用 
6.1 Appendonly表与压缩表 
6.1.1 应用场景及语法介绍 
6.1.2 压缩表的性能差异 
6.1.3 Appendonly表特性 
6.1.4 相关数据字典 
6.2 列存储 
6.2.1 应用场景 
6.2.2 数据文件存储特性 
6.2.3 如何使用列存储 
6.2.4 性能比较 
6.3 外部表高级应用 
6.3.1 外部表实现原理 
6.3.2 可写外部表 
6.3.3 HDFS外部表 
6.3.4 可执行外部表 
6.4 自定义函数—各个编程接口 
6.4.1 pl/pgsql 
6.4.2 C语言接口 
6.4.3 plpython 
6.5 Greenplum MapReduce 
6.6 小结 
第7章 Greenplum架构介绍 
7.1 并行和分布式计算 
7.2 并行数据库 
7.3 Greenplum架构分析 
7.4 冗余与故障切换 
7.5 数据分布及负载均衡 
7.6 跨库关联 
7.7 分布式事务 
7.8 其他大数据分析方案 
7.9 小结 
下篇 管 理 篇 
第8章 Greenplum线上环境部署 
8.1 服务器硬件选型 
8.1.1 CPU 
8.1.2 内存 
8.1.3 磁盘及硬盘接口 
8.1.4 网络 
8.2 服务器系统参数调整 
8.2.1 Solaris参数修改 
8.2.2 Linux参数修改 
8.2.3 系统参数及性能验证 
8.3 计算节点分配技巧 
8.4 数据库参数介绍 
8.5 数据库集群基准测试 
8.6 小结 
第9章 数据库管理 
9.1 用户及权限管理 
9.1.1 Greenplum数据库逻辑结构 
9.1.2 Grant语法 
9.2 登录权限控制 
9.3 资源队列及并发控制 
9.4 Greenplum锁机制 
9.5 数据目录结构 
9.6 数据文件存储分布 
9.7 表空间管理 
9.8 小结 
第10章 数据库监控及调优 
10.1 Linux监控工具介绍 
10.1.1 监控磁盘 
10.1.2 监控网络 
10.1.3 监控CPU 
10.1.4 监控内存 
10.2 安装Performance Monitor 
10.3 监控Segment是否正常 
10.4 VACUUM系统表 
10.5 数据倾斜排查 
10.6 查看子节点的SQL运行状态 
10.7 自动加分区 
10.8 自动赋权 
10.9 清理过期数据 
10.10 小结 
第11章 解读Greenplum维护脚本 
11.1 添加Greenplum Contrib模块 
11.2 启动和关闭脚本gpstart和gpstop 
11.3 初始化系统脚本gpinitsystem 
11.4 集群操作脚本gpssh和gpscp 
11.5 数据库状态检查脚本gpstate 
11.6 数据库升级脚本gpmigrate 
11.7 参数修改脚本gpconfig 
11.8 数据库一致性检查脚本gpcheckcat 
11.9 小结 
第12章 备份及恢复策略 
12.1 Greenplum 3.x 
12.2 Greenplum 4.x 
12.3 gp_dump和pg_dump 
12.4 Greenplum Master备份策略 
12.4.1 增加Standby Master 
12.4.2 重新同步Standby Master 
12.4.3 启用Standby Master 
12.5 小结 
第13章 数据库扩容 
13.1 迁移计算节点 
13.1.1 两种备份方案 
13.1.2 数据迁移实战 
13.2 增加计算节点 
13.3 小结 
第14章 基于Greenplum的海量数据实时分析服务平台 
14.1 需求概述 
14.2 典型方案 
14.2.1 NoSQL 
14.2.2 分布式数据库/集群 
14.2.3 分表分库 
14.2.4 方案优劣分析 
14.3 基于Greenplum的混合架构 
14.3.1 架构分析 
14.3.2 实施要点 
14.4 小结 
第15章 使用Greenplum的常见报错及小技巧 
15.1 分析常见报错 
15.2 常见问题及解决办法 
15.3 常用的一些小技巧 
15.4 小结

我来说两句

本书评论

共有 0 条评论
图书分类
我的书库手机端
帮助中心
会员登录 ×
新用户注册 ×