跳到主要内容
版本:v1.6.x

监控:Flink On Yarn

对Yarn运行模式下的Flink流引擎的通用指标进行测量监控。 监控指标对应的中文含义在本说明文档描述,页面监控显示的指标均为Flink原生指标没有翻译成中文,怕引发歧义。

配置参数

参数名称参数帮助描述
监控Host被监控的对端IPV4,IPV6或域名。注意⚠️不带协议头(eg: https://, http://)。
任务名称标识此监控的名称,名称需要保证唯一性。
Yarn端口Yarn的端口,对应配置项:yarn.resourcemanager.webapp.address中的端口
查询超时时间设置JVM连接的超时时间,单位ms毫秒,默认3000毫秒。
启动SSL是否启用SSL
用户名连接用户名
密码连接密码
监控周期监控周期性采集数据间隔时间,单位秒,可设置的最小间隔为30秒
绑定标签用于对监控资源进行分类管理。
描述备注更多标识和描述此监控的备注信息,用户可以在这里备注信息。

采集指标

指标集合:JobManager Metrics

指标名称指标单位指标帮助描述
Status.JVM.Memory.NonHeap.Committed字节非堆内存的提交量
Status.JVM.Memory.Mapped.TotalCapacity字节映射内存的总容量
Status.JVM.Memory.NonHeap.Used字节非堆内存的使用量
Status.JVM.Memory.Metaspace.Max字节元空间的最大容量
Status.JVM.GarbageCollector.G1_Old_Generation.Count字节老年代垃圾收集次数
Status.JVM.Memory.Direct.MemoryUsed字节直接内存的使用量
Status.JVM.Memory.Mapped.MemoryUsed字节映射内存的使用量
Status.JVM.GarbageCollector.G1_Young_Generation.Count字节年轻代垃圾收集次数
Status.JVM.Memory.Direct.TotalCapacity字节直接内存的总容量
Status.JVM.GarbageCollector.G1_Old_Generation.Time字节老年代垃圾收集时间
Status.JVM.Memory.Heap.Committed字节堆内存的提交量
Status.JVM.Memory.Mapped.Count-映射内存的数量
Status.JVM.Memory.Metaspace.Used字节元空间的使用量
Status.JVM.Memory.Direct.Count-直接内存的数量
Status.JVM.Memory.Heap.Used字节堆内存的使用量
Status.JVM.Memory.Heap.Max字节堆内存的最大容量
Status.JVM.GarbageCollector.G1_Young_Generation.Time字节年轻代垃圾收集时间
Status.JVM.Memory.NonHeap.Max字节非堆内存的最大容量

指标集合:JobManager Config

指标名称指标单位指标帮助描述
internal.jobgraph-path-内部作业图路径
env.java.home-Java 环境路径
classloader.check-leaked-classloader-是否检查类加载器
env.java.opts-Java 选项
high-availability.cluster-id-高可用性集群 ID
jobmanager.rpc.address-JobManager 的 RPC 地址
jobmanager.memory.jvm-overhead.min字节JobManager 的 JVM 开销最小值
jobmanager.web.port端口号JobManager 的 Web 端口
webclient.port端口号Web 客户端端口
execution.savepoint.ignore-unclaimed-state-是否忽略未声明的状态
io.tmp.dirs路径临时文件目录
parallelism.default-默认并行度
taskmanager.memory.fraction-TaskManager 内存占比
taskmanager.numberOfTaskSlots-TaskManager 的任务槽数量
yarn.application.name-Yarn 应用名称
taskmanager.heap.mbMBTaskManager 堆内存大小
taskmanager.memory.process.sizeGBTaskManager 进程内存大小
web.port端口号Web 端口
classloader.resolve-order-类加载器解析顺序
jobmanager.heap.mbMBJobManager 堆内存大小
jobmanager.memory.off-heap.size字节JobManager 堆外内存大小
state.backend.incremental-状态后端是否增量
execution.target-执行目标
jobmanager.memory.process.sizeGBJobManager 进程内存大小
web.tmpdir路径Web 临时目录
yarn.ship-files路径Yarn 传输文件
jobmanager.rpc.port端口号JobManager 的 RPC 端口
internal.io.tmpdirs.use-local-default-是否使用本地默认临时目录
execution.checkpointing.interval毫秒检查点间隔
execution.attached-是否附加执行
internal.cluster.execution-mode-内部集群执行模式
execution.shutdown-on-attached-exit-是否在附加退出时关闭
pipeline.jars路径管道 JAR 文件
rest.address-REST 地址
state.backend-状态后端类型
jobmanager.memory.jvm-metaspace.size字节JobManager JVM 元空间大小
$internal.deployment.config-dir路径内部部署配置目录
$internal.yarn.log-config-file路径内部 Yarn 日志配置文件路径
jobmanager.memory.heap.size字节JobManager 堆内存大小
state.checkpoints.dir路径状态检查点目录
jobmanager.memory.jvm-overhead.max字节JobManager 的 JVM 开销最大值

TaskManager

指标名称指标单位指标帮助描述
Container ID-容器 ID,用于唯一标识一个容器
Path-容器路径
Data Port端口号数据传输端口
JMX Port端口号JMX(Java Management Extensions)端口
Last Heartbeat时间戳最后一次心跳时间
All Slots数量容器中所有任务槽的数量
Free Slots数量容器中空闲任务槽的数量
totalResourceCpuCores核心数容器总的CPU核心数
totalResourceTaskHeapMemoryMB容器总的任务堆内存大小
totalResourceManagedMemoryMB容器总的托管内存大小
totalResourceNetworkMemoryMB容器总的网络内存大小
freeResourceCpuCores核心数容器中空闲的CPU核心数
freeResourceTaskHeapMemoryMB容器中空闲的任务堆内存大小
freeResourceTaskOffHeapMemoryMB容器中空闲的任务堆外内存大小
freeResourceManagedMemoryMB容器中空闲的托管内存大小
freeResourceNetworkMemoryMB容器中空闲的网络内存大小
CPU Cores核心数CPU核心数
Physical MEMMB物理内存大小
JVM Heap SizeMBJVM堆内存大小
Flink Managed MEMMBFlink管理的内存大小
Framework HeapMB框架堆内存大小
Task HeapMB任务堆内存大小
Framework Off-HeapMB框架堆外内存大小
memoryConfigurationTaskOffHeapByte任务堆外内存配置
NetworkMB网络内存配置
Managed MemoryMB托管内存配置
JVM MetaspaceMBJVM元空间大小
JVM OverheadMBJVM开销
memoryConfigurationTotalFlinkMemoryByteFlink总内存配置
memoryConfigurationTotalProcessMemoryByte进程总内存配置

TaskManager Metrics

指标名称指标单位指标帮助描述
Status.Shuffle.Netty.TotalMemoryMBNetty Shuffle 使用的总内存
Status.Flink.Memory.Managed.UsedMBFlink 管理的已用内存
Status.JVM.Memory.Metaspace.UsedMBJVM 元空间已使用的内存
Status.JVM.Memory.Metaspace.MaxMBJVM 元空间的最大内存
Status.JVM.Memory.Heap.UsedMBJVM 堆内存已使用的内存
Status.JVM.Memory.Heap.MaxMBJVM 堆内存的最大容量
Status.Flink.Memory.Managed.TotalMBFlink 管理的内存总量
Status.Shuffle.Netty.UsedMemoryMBNetty Shuffle 使用的内存