李林超博客
首页
归档
留言
友链
动态
关于
归档
留言
友链
动态
关于
首页
大数据
正文
05.Flink Standalone模式单机版安装
Leefs
2021-12-23 PM
2243℃
0条
[TOC] ### 一、概述 #### 1.1 介绍 flink的 standalone(standalone deploy mode)部署模式,指的是flink直接在操作系统上启动flink相关服务如client, jobmanager, taskmanager,而不依赖其它资源管理框架如yarn, mesos, k8s进行资源管理。 此时是由flink直接来进行集群资源管理的,比如监控和重启失败的服务进程,分配和释放资源等等。 #### 1.2 Standalone单机版说明 - JobManager 和 TaskMananger 全部在一个 node 上运行 - 仅适用于本地测试,不适用于生产环境 - 仅支持 Session Mode 提交 Job - 不支持高可用 ### 二、Flink Standalone单机版安装步骤 #### 2.1 环境准备 + CentOS 7.X + JDK 1.8 #### 2.2 安装 **(1)下载** ```shell wget https://dlcdn.apache.org/flink/flink-1.14.2/flink-1.14.2-bin-scala_2.12.tgz ``` **(2)将flink-1.14.2-bin-scala_2.12.tgz安装包上传到服务器并解压到安装目录** ```basic [root@hadoop001 hadoop]# tar -zxf flink-1.14.2-bin-scala_2.12.tgz -C /opt/software/ ``` **(3)修改flink-conf.yaml配置** ```shell [root@hadoop001 conf]# pwd /opt/software/flink-1.14.2/conf [root@hadoop001 conf]# vim flink-conf.yaml ``` + **修改如下配置** ```yaml # JobManager进行RPC通信的地址 jobmanager.rpc.address: localhost # JobManager进行RPC通信的端口 jobmanager.rpc.port: 6123 # JobManager的总进程内存大小 jobmanager.memory.process.size: 2048m # TaskManager的总进程内存大小 taskmanager.memory.process.size: 4096m # 每台taskmanager可用的solt数目,一般设置成CPU的core数 taskmanager.numberOfTaskSlots: 4 # 用于未指定的程序的并行性和其他并行性 parallelism.default: 1 # 指定JobManger的可视化端口,尽量配置一个不容易冲突的端口 rest.port: 8086 ``` 说明:flink默认的rest.port的端口是8081,如果主机的8081端口被占用换成没被占用的端口号。 **(4)配置masters** ```shell [root@hadoop001 conf]# vim masters localhost:8086 ``` **(5)配置workers** ```shell [root@hadoop001 conf]# vim workers localhost ``` **(6)启动** ```shell [root@hadoop001 flink-1.14.2]# ./bin/start-cluster.sh ``` **(7)查看运行进程** ```shell [root@hadoop001 flink-1.14.2]# jps 5524 StandaloneSessionClusterEntrypoint 5797 TaskManagerRunner ``` **(8)访问web UI界面** 访问地址:http://192.168.159.139:8086/ ![05.Flink Standalone单机版安装01.jpg](https://lilinchao.com/usr/uploads/2021/12/369155879.jpg) ### 三、运行任务 #### 3.1 命令行方式 **(1)上传flinkdemo-1.0.jar包到服务器** flinkdemo-1.0.jar程序可参考之前文章:[03.Flink入门案例](https://lilinchao.com/archives/1769.html) 注意:引入依赖时,换成如下flink 1.14版本的依赖 ```xml
org.apache.flink
flink-scala_2.12
1.14.2
org.apache.flink
flink-streaming-scala_2.12
1.14.2
org.apache.flink
flink-clients_2.12
1.14.2
``` **(2)提交任务命令** ```bash [root@hadoop001 flink-1.14.2]# ./bin/flink run -c com.lilinchao.flink.wordcount.BatchWordCount -p 2 /home/hadoop/flinkdemo-1.0.jar --path /home/hadoop/datas/word.txt ``` **运行结果** ![05.Flink Standalone单机版安装02.jpg](https://lilinchao.com/usr/uploads/2021/12/1024481821.jpg) **(3)其他命令** ```shell # 查看正在运行任务列表以及任务id [root@hadoop001 flink-1.14.2]# ./bin/flink list # 取消任务 [root@hadoop001 flink-1.14.2]# ./bin/flink cancel [任务id] # 查看所有的任务包括正在运行、运行结束、被取消任务 [root@hadoop001 flink-1.14.2]# ./bin/flink list -a ``` #### 3.2 web界面操作 **(1)从本地上传Jar包** ![05.Flink Standalone单机版安装03.jpg](https://lilinchao.com/usr/uploads/2021/12/2086743455.jpg) **(2)运行netcat监听8002端口** ```shell [root@hadoop001 ~]# nc -lk 8002 ``` **(3)设置配置参数** ![05.Flink Standalone单机版安装04.jpg](https://lilinchao.com/usr/uploads/2021/12/3146822158.jpg) **参数说明** + **Entry Class:**主函数执行Class文件目录 + **Parallelism:**任务的最大调度,如果程序里边配置了,就以程序为准,不然就以此处为准,如果此处也不进行配置,以配置文件中配置为准。 **优先级**:程序内配置>提交任务配置>配置文件配置 + **Program Arguments:**需要传递的参数 + **Savepoint Path:**输出结果路径 + **Show Plan:**点击进去可以看到任务的执行流程以及每个步骤的调度数 + **Submit:提交任务** **(4)查看运行过程** ![05.Flink Standalone单机版安装05.jpg](https://lilinchao.com/usr/uploads/2021/12/2920115349.jpg) **(5)在netcat输出内容,通过Task Managers查看运行日志** ![05.Flink Standalone单机版安装06.jpg](https://lilinchao.com/usr/uploads/2021/12/1328670614.jpg) **(6)结束任务** 点击Cancel Job即可结束正在运行的任务 ![05.Flink Standalone单机版安装07.jpg](https://lilinchao.com/usr/uploads/2021/12/2841486782.jpg) ### 结尾 如果需要上方运行Jar包可以直接通过微信公众号:【Java和大数据进阶】,回复:【flink】即可获取。
标签:
Flink
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:
https://lilinchao.com/archives/1780.html
上一篇
04.Flink本地模式部署
下一篇
06.Flink Yarn模式介绍
评论已关闭
栏目分类
随笔
2
Java
326
大数据
229
工具
31
其它
25
GO
47
NLP
4
标签云
数据结构
排序
SQL练习题
正则表达式
Flume
Http
Java编程思想
RSA加解密
gorm
Stream流
ClickHouse
DataX
Shiro
JavaWEB项目搭建
VUE
Quartz
FastDFS
Eclipse
Yarn
Spring
Kibana
机器学习
Spark
Sentinel
国产数据库改造
Spark Streaming
算法
pytorch
SpringCloud
HDFS
友情链接
申请
范明明
庄严博客
Mx
陶小桃Blog
虫洞
评论已关闭