Hadoop

肖钟城
  • 大数据技术栈
小于 1 分钟

Hadoop

概览

hadoop_logo

Apache™Hadoop®项目开发可靠、可扩展的分布式计算的开源软件。

Apache Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群进行分布式处理大型数据集。 它被设计成从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。 与依赖硬件提供高可用性不同,库本身的设计目的是检测和处理应用层的故障,因此在计算机集群上提供高可用性服务,而每台计算机都可能发生故障。

其包括如下模块:

  • Hadoop Common:支持其他Hadoop模块的通用工具。
  • Hadoop Distributed File System (HDFS™):分布式文件系统,提供对应用数据的高吞吐量访问。
  • Hadoop YARN:一个用于作业调度和集群资源管理的框架。
  • Hadoop MapReduce:基于yarn的大数据集并行处理系统。
评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v2.14.1