Skip to main content
Version: v1.4.x

监控:DORIS数据库FE监控

对DORIS数据库FE的通用性能指标进行采集监控。支持DORIS2.0.0。

配置参数

参数名称参数帮助描述
监控Host被监控的对端IPV4,IPV6或域名。注意⚠️不带协议头(eg: https://, http://)
任务名称标识此监控的名称,名称需要保证唯一性
端口数据库对外提供的端口,默认为8030
查询超时时间设置连接未响应的超时时间,单位ms毫秒,默认3000毫秒
数据库名称数据库实例名称,可选
采集间隔监控周期性采集数据间隔时间,单位秒,可设置的最小间隔为30秒
是否探测新增监控前是否先探测检查监控可用性,探测成功才会继续新增修改操作
描述备注更多标识和描述此监控的备注信息,用户可以在这里备注信息

采集指标

指标集合:doris_fe_connection_total

指标名称指标单位指标帮助描述
value当前FE的MySQL端口连接数

指标集合:doris_fe_edit_log_clean

不应失败,如失败,需人工介入

指标名称指标单位指标帮助描述
success清理历史元数据日志成功的次数
failed清理历史元数据日志失败的次数

指标集合:doris_fe_edit_log

指标名称指标单位指标帮助描述
write元数据日志写入次数的计数
read元数据日志读取次数的计数
current元数据日志当前数量
accumulated_bytes字节元数据日志写入量的累计值
current_bytes字节元数据日志当前值

指标集合:doris_fe_image_clean

不应失败,如失败,需人工介入

指标名称指标单位指标帮助描述
success清理历史元数据镜像文件成功的次数
failed清理历史元数据镜像文件失败的次数

指标集合:doris_fe_image_write

不应失败,如失败,需人工介入

指标名称指标单位指标帮助描述
success生成元数据镜像文件成功的次数
failed生成元数据镜像文件失败的次数

指标集合:doris_fe_query_err

指标名称指标单位指标帮助描述
value错误查询的累积值

指标集合:doris_fe_max_journal_id

指标名称指标单位指标帮助描述
value当前FE节点最大元数据日志ID。如果是Master FE,则是当前写入的最大ID,如果是非Master FE,则代表当前回放的元数据日志最大ID。用于观察多个FE之间的 id 是否差距过大。过大则表示元数据同步出现问题

指标集合:doris_fe_max_tablet_compaction_score

指标名称指标单位指标帮助描述
value所有BE节点中最大的 compaction score 值。该值可以观测当前集群最大的 compaction score,以判断是否过高。如过高则可能出现查询或写入延迟

指标集合:doris_fe_qps

指标名称指标单位指标帮助描述
value当前FE每秒查询数量(仅统计查询请求)

指标集合:doris_fe_query_err_rate

指标名称指标单位指标帮助描述
value每秒错误查询数

指标集合:doris_fe_report_queue_size

指标名称指标单位指标帮助描述
valueBE的各种定期汇报任务在FE端的队列长度,该值反映了汇报任务在 Master FE 节点上的阻塞程度,数值越大,表示FE处理能力不足

指标集合:doris_fe_rps

指标名称指标单位指标帮助描述
value当前FE每秒请求数量(包含查询以及其他各类语句)

指标集合:doris_fe_scheduled_tablet_num

指标名称指标单位指标帮助描述
valueMaster FE节点正在调度的 tablet 数量。包括正在修复的副本和正在均衡的副本,该数值可以反映当前集群,正在迁移的 tablet 数量。如果长时间有值,说明集群不稳定

指标集合:doris_fe_txn_status

可以观测各个状态下导入事务的数量,来判断是否有堆积

指标名称指标单位指标帮助描述
unknown未知
prepare准备中
committed已提交
visible可见
aborted已中止/已撤销