Tez

肖钟城
  • 大数据技术栈
小于 1 分钟

Tez

概览

Apache Tez是构建于Apache Hadoop YARN上,基于有向无环图进行数据处理的框架。

主要设计主题:

  • 授权终端用户

    • 表达性数据流定义API

    • 灵活的输入处理输出运行模型

    • 数据类型无关

    • 极易部署

  • 执行性能

    • 优于mapreduce

    • 优化资源管理

    • 运行时计划重新配置

    • 动态物理数据流决策

通过允许像Apache Hive和Apache Pig这样的项目运行复杂的DAG任务,Tez可以用来处理数据,以前需要多个MR任务,现在只需要一个Tez任务,如下所示。

tez基础入门

apache tez编译安装与验证

评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v2.14.1