博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
开源大数据周刊-第3期
阅读量:7030 次
发布时间:2019-06-28

本文共 1082 字,大约阅读时间需要 3 分钟。

摘要:
赫拉利:数据崇拜将无边无际,Apache Apex成为顶级项目。

阿里云E-Mapreduce动态

  • 团队发布VPC方案,可以帮助用户构建出一个隔离的网络环境,此外您也可以通过专线/ VPN 等连接方式将 VPC 与传 统数据中心组成一个按需定制的网络环境,实现大数据混合云架构,大数据可以先上云。
  • 已经发布到github上,用户可以基于此demo继续开发自身的业务
  • 团队准备了初学者教学视频,初学着可以在10分钟内跑通一个简单的hadoop作业
  • 团队即将增加zepplin和hue等交互式处理软件,用户可以直接写SQL甚至写python、scala代码交互式执行,查看运行结果

资讯播报

  • 文中说数据不是黄金,不是石油,而是土壤,跟以往的任何资源不同,你越用越多。数据是智慧社会的基础。
  • 分工是推动人类社会进步的原动力,不久的将来,一切皆服务,一切IT也皆服务。文中认为大数据尚未跟云计算有机结合,但是这个趋势不可避免。
  • 在这个人人都谈大数据的年代,银行也不例外。银行也在去IOE,慢慢拥抱开源Hadoop等大数据平台的环抱。
  • 这些年轻估值数亿美元的数据大公司,有的是直接的大数据Hadoop的提供商如Cloudera,有的直接在某个行业的精耕细作,用大数据,提高效率,带来价值。
  • 近日,数据库平台开发初创企业MemSQL宣布完成C轮融资,融资金额为3600万美元。
  • Apache Apex是一个同时能处理流式与批处理的计算引擎,目前除了正炽热的spark、还有新星flink外,Apache Apex是否可以成为下一个热点,与以往的spark、flink有哪些不同,我们还得持续深入的关注。
  • Kudu:一个为大数据快速分析量身定制的新型Apache Hadoop存储系统。Kudu能结合两个系统优点,同时支持高吞吐率和低延迟。当前的测试结果也表明,目前也基本能达到。不过目前国内还缺少成功的线上案例,Kudu目前还是孵化器项目,相信再等一段时间kudu会越来越稳定。
  • LogHub是阿里自主研发的日志服务,文中从易用性、稳定性、功能、成本等方面讲述了LogHub与Kafka的异同。
  • flink在2015年1月成为apache的top项目后,在最近发布了1.0.0的版本。flink跟hadoop生态圈结合的很好,可以运行在HDFS、YARN上运行。跟spark类似,他也是支持全的分析处理模型,且从目前来看理论上比spark更为先进。不过flink社区比spark还是逊色很多,在国内没有较多线上运行的案例。本文简单介绍了flink基本的知识,不妨一看。

转载地址:http://pnwal.baihongyu.com/

你可能感兴趣的文章
[leetcode 240]Search a 2D Matrix II
查看>>
域名指的是这一级目录
查看>>
[Angular] Creating an Observable Store with Rx
查看>>
[转]Porting to Oracle with Entity Framework NLog
查看>>
chmod更改文件的权限
查看>>
oracle 10g/11g RAC 启停归档模式
查看>>
poj3461 Oulipo
查看>>
OAuth2.0学习(1-12)开源的OAuth2.0项目和比较
查看>>
Gitlab,这也就O了???
查看>>
2014 百度之星 1003 题解 Xor Sum
查看>>
Linux中在主机上实现对备机上文件夹及文件的操作的C代码实现
查看>>
iOS 块的简单理解
查看>>
idea中如何配置git以及在idea中初始化git
查看>>
关于JQuery Class选择器的一点
查看>>
POJ3264 Balanced Lineup
查看>>
redis-cli 连接远程服务器
查看>>
emlog通过pjax实现无刷新加载网页--完美解决cnzz统计和javascript失效问题
查看>>
sublime 之 vitage/emmet
查看>>
代码管理(四)SVN和Git对比
查看>>
python - hadoop,mapreduce demo
查看>>