原创

第二本书出版啦!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://wxy0327.blog.csdn.net/article/details/79711827



        这是目前唯一一本介绍HAWQ技术的中文书。涵盖HAWQ技术解析、其上的数仓架构及实现、简单数据挖掘三部分,内容较为全面,每部分均有详细配置说明及示例代码。用不打折扣的SQL教据库玩转大数据,无论是学习、开发,还是部署、运行,HAWQ是你的效率之选!

        我体验的HAWQ五大特点:

  • 依赖少:只需要HDFS一种Hadoop基础服务作为底层存储(相比Kylin)。
  • 性能高:比Hive快一个数量级以上,而且不需要预先建立cube(相比其它)。
  • 兼容全:全面兼容SQL标准,涵盖所有常用窗口、分析、聚合函数(相比Impala)。
  • 可编程:能在Hadoop上编写SQL UDF(相比其它)。
  • 易挖掘:原生支持MADlib,仅用SQL查询就能进行简单的数据挖掘与机器学习(相比其它)。
        四点建议,前三点是我了解用户提的比较多的,最后一个是当前热点技术。
  • 实现行级更新(update/delete)、索引、with recursive、pivot等基本功能;
  • 增强外部表的支持(如外部分区表等),提高外部表性能;
  • 提高除HDP外其它Hadoop发行版本的支持与普适度;
  • 增强机器学习库(MADlib)。
        这些优缺点在书中均以实例进行论述。感谢CSDN的blog平台!感谢偶数科技的常雷博士所作推荐序!
文章最后发布于: 2018-03-27 13:39:59
展开阅读全文
0 个人打赏
私信求帮助

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览