[TOC]一、Flow 2.0简介1.1 Flow 2.0的产生Azkaban 目前同时支持 Flow 1.0 和 Flow2.0 ,但是官方文档上更推荐使用 Flow 2.0,因为 Flow 1.0 会在将来的版本被移除。Flow 2.0 的主要设计思想是提供 1.0 所没有的流级定义。用户可以将属于给定流的所有 job / properties 文件合并到单个流定义文件中,其内容采用 Y...
[TOC]前言Azkaban 2.0支持properties配置文件,也支持YML配置文件Azkaban 3.0默认支持YML配置文件Hello World案例实操(1)在windows环境新建first.project文件,增加如下内容azkaban-flow-version: 2.0注意:该文件作用,是采用新的Flow-API方式解析flow文件。文件必须以.project结尾。(2)新...
前言环境准备MySQL数据库JDK1.8本次安装Azkaban版本Azkaban-3.84.4一、安装步骤1、上传文件(1)将安装包上传到服务器上(2)创建目录,解压安装包到对应目录[hadoop@hadoopserver local]$ mkdir azkaban [hadoop@hadoopserver azkaban]$ tar -zxf azkaban-db-3.84.4.tar.g...
前言为什么需要工作流调度器一个完整的数据分析系统通常都是由大量任务单元组成: shell 脚本程序,java 程序,mapreduce 程序、hive 脚本等;各任务单元之间存在时间先后及前后依赖关系;为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行。常见任务调度工具crontab (Linux 自带命令,使用方式简单,适合不是非常复杂的场景,比如只按照时间来调度)ooz...