摘要:
赫拉利:数据崇拜将无边无际,Apache Apex成为顶级项目。 阿里云E-Mapreduce动态
- 团队发布VPC方案,可以帮助用户构建出一个隔离的网络环境,此外您也可以通过专线/ VPN 等连接方式将 VPC 与传 统数据中心组成一个按需定制的网络环境,实现大数据混合云架构,大数据可以先上云。
- 已经发布到github上,用户可以基于此demo继续开发自身的业务
- 团队准备了初学者教学视频,初学着可以在10分钟内跑通一个简单的hadoop作业
- 团队即将增加zepplin和hue等交互式处理软件,用户可以直接写SQL甚至写python、scala代码交互式执行,查看运行结果
资讯播报
- 文中说数据不是黄金,不是石油,而是土壤,跟以往的任何资源不同,你越用越多。数据是智慧社会的基础。
- 分工是推动人类社会进步的原动力,不久的将来,一切皆服务,一切IT也皆服务。文中认为大数据尚未跟云计算有机结合,但是这个趋势不可避免。
- 在这个人人都谈大数据的年代,银行也不例外。银行也在去IOE,慢慢拥抱开源Hadoop等大数据平台的环抱。
- 这些年轻估值数亿美元的数据大公司,有的是直接的大数据Hadoop的提供商如Cloudera,有的直接在某个行业的精耕细作,用大数据,提高效率,带来价值。
- 近日,数据库平台开发初创企业MemSQL宣布完成C轮融资,融资金额为3600万美元。
- Apache Apex是一个同时能处理流式与批处理的计算引擎,目前除了正炽热的spark、还有新星flink外,Apache Apex是否可以成为下一个热点,与以往的spark、flink有哪些不同,我们还得持续深入的关注。
- Kudu:一个为大数据快速分析量身定制的新型Apache Hadoop存储系统。Kudu能结合两个系统优点,同时支持高吞吐率和低延迟。当前的测试结果也表明,目前也基本能达到。不过目前国内还缺少成功的线上案例,Kudu目前还是孵化器项目,相信再等一段时间kudu会越来越稳定。
- LogHub是阿里自主研发的日志服务,文中从易用性、稳定性、功能、成本等方面讲述了LogHub与Kafka的异同。
- flink在2015年1月成为apache的top项目后,在最近发布了1.0.0的版本。flink跟hadoop生态圈结合的很好,可以运行在HDFS、YARN上运行。跟spark类似,他也是支持全的分析处理模型,且从目前来看理论上比spark更为先进。不过flink社区比spark还是逊色很多,在国内没有较多线上运行的案例。本文简单介绍了flink基本的知识,不妨一看。