正文

什么是Hadoop分析?

Hadoop是一种用于业务分析处理的环境。允许大量的计算算来处理超大型非结构化数据集。这些数据可以来自于各种源,但是最常见的数据是通过作为物联网的一部分的传感器创造的数据。为了让其分析处理是有价值的,Hadoop必须快速处理这些数据集,而且要通过Hadoop分布式文件系统(HDFS)实现。HDFS本质上将计算转移到数据,而不是传输数据到计算。

大多数Hadoop环境由商用服务器集群组成,都有本地存储。数据加载到这些结点,在那里处理那个数据集。这称之为MapReduce功能。一旦每一个结点基于请求处理那个数据,结果就会从每一个结点发送,然后在一个主结点合并。主结点也存储与集群管理相关的所有元数据。