Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop的框架最核心的设计就是HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。
一图简述大数据技术生态圈
2016-10-31 13:21
下面是一张生态图,主要的组件都是为了方便大家从底层的MapReduce模型中脱离出来。 详细
优步在Hadoop上做增量处理的案例
2016-10-09 09:36
在本文中,我想基于在优步建立数据基础设施的经验和经历,讨论准实时案例中数据处理系统的选择。 详细
数据太大?你该了解Hadoop分布式文件系统
2016-09-20 16:42
数据产生后,意味着数据的采集工作已经完成,那么数据的输入与有效输出问题怎么破解? 详细
数据湖:大数据游泳的安全方式?
2016-09-02 13:25
在这篇文章中,专家想澄清数据池是什么,组织是否会考虑使用数据湖,以及他们使用数据湖所面临的挑战。 详细
Hadoop的过去、现在和未来
2016-09-01 12:04
Hadoop是目前大数据分析领域中应用最广泛的一种分布式架构,而经过相当长时间的发展,Hadoop在功能上也 ... 详细