开源大数据周刊-第3期-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

开源大数据周刊-第3期

阅读量：7030 次

发布时间：2019-06-28

本文共 1082 字，大约阅读时间需要 3 分钟。

摘要：

赫拉利：数据崇拜将无边无际，Apache Apex成为顶级项目。

阿里云E-Mapreduce动态

团队发布VPC方案，可以帮助用户构建出一个隔离的网络环境，此外您也可以通过专线/ VPN 等连接方式将 VPC 与传统数据中心组成一个按需定制的网络环境，实现大数据混合云架构，大数据可以先上云。

已经发布到github上，用户可以基于此demo继续开发自身的业务

团队准备了初学者教学视频，初学着可以在10分钟内跑通一个简单的hadoop作业

团队即将增加zepplin和hue等交互式处理软件，用户可以直接写SQL甚至写python、scala代码交互式执行，查看运行结果

资讯播报

文中说数据不是黄金，不是石油，而是土壤，跟以往的任何资源不同，你越用越多。数据是智慧社会的基础。

分工是推动人类社会进步的原动力，不久的将来，一切皆服务，一切IT也皆服务。文中认为大数据尚未跟云计算有机结合，但是这个趋势不可避免。

在这个人人都谈大数据的年代，银行也不例外。银行也在去IOE，慢慢拥抱开源Hadoop等大数据平台的环抱。

这些年轻估值数亿美元的数据大公司，有的是直接的大数据Hadoop的提供商如Cloudera，有的直接在某个行业的精耕细作，用大数据，提高效率，带来价值。

近日，数据库平台开发初创企业MemSQL宣布完成C轮融资，融资金额为3600万美元。

Apache Apex是一个同时能处理流式与批处理的计算引擎，目前除了正炽热的spark、还有新星flink外，Apache Apex是否可以成为下一个热点，与以往的spark、flink有哪些不同，我们还得持续深入的关注。

Kudu：一个为大数据快速分析量身定制的新型Apache Hadoop存储系统。Kudu能结合两个系统优点，同时支持高吞吐率和低延迟。当前的测试结果也表明，目前也基本能达到。不过目前国内还缺少成功的线上案例，Kudu目前还是孵化器项目，相信再等一段时间kudu会越来越稳定。

LogHub是阿里自主研发的日志服务，文中从易用性、稳定性、功能、成本等方面讲述了LogHub与Kafka的异同。

flink在2015年1月成为apache的top项目后，在最近发布了1.0.0的版本。flink跟hadoop生态圈结合的很好，可以运行在HDFS、YARN上运行。跟spark类似，他也是支持全的分析处理模型，且从目前来看理论上比spark更为先进。不过flink社区比spark还是逊色很多，在国内没有较多线上运行的案例。本文简单介绍了flink基本的知识，不妨一看。

转载地址：http://pnwal.baihongyu.com/

你可能感兴趣的文章

[leetcode 240]Search a 2D Matrix II

域名指的是这一级目录

[Angular] Creating an Observable Store with Rx

[转]Porting to Oracle with Entity Framework NLog

chmod更改文件的权限

oracle 10g/11g RAC 启停归档模式

OAuth2.0学习（1-12）开源的OAuth2.0项目和比较

Gitlab，这也就O了？？？

2014 百度之星 1003 题解 Xor Sum

Linux中在主机上实现对备机上文件夹及文件的操作的C代码实现

iOS 块的简单理解

idea中如何配置git以及在idea中初始化git

关于JQuery Class选择器的一点

POJ3264 Balanced Lineup

redis-cli 连接远程服务器

emlog通过pjax实现无刷新加载网页--完美解决cnzz统计和javascript失效问题

sublime 之 vitage/emmet

代码管理（四）SVN和Git对比

python - hadoop,mapreduce demo

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-06 16:37:57 当前IP: 18.219.25.181 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我