一、视频课程
为了让大家系统的学习Greenplum ETL,Greenplum中文社区为大家准备了ETL连载课程《每天5分钟,一起学ETL》,每周三更新,目前的课程限时免费哦!这套课程旨在帮助大家从GPFDIST和GPLOAD开始,到GPCOPY、PXF,理论结合实践,详细介绍Greenplum ETL工具。
从安装部署入手、涵盖备份、恢复、安全与高可用、到快速调优、生态与工具、以及常见问题,不管你是Greenplum小萌新,还是Greenplum老江湖,相信你都可以从《六节课快速上手Greenplum》系列课程中有所收获。
Greenplum 虽然基于 PostgreSQL,但针对大数据的场景和用户对性能的极致追求开发了大量的特性和做了极致甚至苛刻的优化。此外,Greenplum紧密拥抱Postgres社区,以敏捷的方式快速升级Postgres内核。为了让大家对Greenplum的内核有更深入的了解,让大家在开发或者是使用Greenplum过程中更加得心应手,我们开发了此课程。
通过 Pivotal 开源的 Apache顶级项目 MADlib ,Greenplum 可以在数据内部运行 50 多种数据分析和机器学习算法。支持商业智能 (BI)、文本、GIS、图、图像、流式数据处理等。本课程包括十个大章的内容,从机器学习的前世今生,到机器学习算法的各类算法与实践,全面系统。
二、书籍
《Greenplum:从大数据战略到实现》
作者:冯雷、姚延栋、高小明、杨瑜
本书为Greenplum核心开发团队官方出品,全面解读开源MPP大数据平台开发与实践从大数据战略到落地,多维度助力企业数字化转型。内容全面,涵盖大数据战略、Greenplum架构、ETL、Greenplum的机器学习与数据分析工具、运维和迁移等大家所需要的各种干货。
我们希望本书能给已经建立或者准备建立大数据平台的企业决策者、架构师、开发人员、数据工程师、数据科学家和数据库管理员带来帮助,也希望从事大数据科研工作的教育工作者和学生能从中受益。
《Greenplum企业应用实战》
作者:何勇 / 陈晓峰
本书于2014年出版,阿里巴巴是国内Greenplum的早期用户之一,也是Greenplum的重要合作伙伴。本书的两位作者是阿里巴巴最早负责使用和维护Greenplum的技术工程师,权威性毋庸置疑。本书完全立足于阿里巴巴的企业应用实践,不仅系统介绍Greenplum的功能特性、使用方法、高级应用,而且还详细讲解Greenplum的系统架构、运维管理、性能优化和各种技巧。最重要的是,包含大量企业级应用案例,每个案例都进行了详尽的讲解和实操指导。
三、其他内容
Greenplum 管理员指南 6.0.0
本文档由陈淼结合多年实战经验,根据最新的版本特性重新整理,编写和贡献,大部分内容都经过编者重新考量和实测验证,有些观点与官方手册有出入,仅代表编者本人观点,与官方手册无关。