跳到主要内容
版本:v1.6.x

监控 Hbase RegionServer监控

对Hbase RegionServer的通用性能指标进行采集监控

使用协议:HTTP

监控前操作

查看 hbase-site.xml 文件,获取 hbase.regionserver.info.port 配置项的值,该值用作监控使用。

配置参数

参数名称参数帮助描述
目标Host被监控的对端IPV4,IPV6或域名。注意⚠️不带协议头(eg: https://, http://)。
端口hbase regionserver的端口号,默认为16030。即:hbase.regionserver.info.port参数值
任务名称标识此监控的名称,名称需要保证唯一性。
查询超时时间设置连接的超时时间,单位ms毫秒,默认3000毫秒。
采集间隔监控周期性采集数据间隔时间,单位秒,可设置的最小间隔为30秒
是否探测新增监控前是否先探测检查监控可用性,探测成功才会继续新增修改操作
描述备注更多标识和描述此监控的备注信息,用户可以在这里备注信息

采集指标

所有指标名称均直接引用官方的字段,所以存在命名不规范。

指标集合:server

指标名称指标单位指标帮助描述
regionCountRegion数量
readRequestCount重启集群后的读请求数量
writeRequestCount重启集群后的写请求数量
averageRegionSizeMB平均Region大小
totalRequestCount全部请求数量
ScanTime_num_opsScan 请求总量
Append_num_opsAppend 请求量
Increment_num_opsIncrement请求量
Get_num_opsGet 请求量
Delete_num_opsDelete 请求量
Put_num_opsPut 请求量
ScanTime_mean平均 Scan 请求时间
ScanTime_min最小 Scan 请求时间
ScanTime_max最大 Scan 请求时间
ScanSize_meanbytes平均 Scan 请求大小
ScanSize_min最小 Scan 请求大小
ScanSize_max最大 Scan 请求大小
slowPutCount慢操作次数/Put
slowGetCount慢操作次数/Get
slowAppendCount慢操作次数/Append
slowIncrementCount慢操作次数/Increment
slowDeleteCount慢操作次数/Delete
blockCacheSize缓存块内存占用大小
blockCacheCount缓存块数量_Block Cache 中的 Block 数量
blockCacheExpressHitPercent读缓存命中率
memStoreSizeMemstore 大小
FlushTime_num_opsRS写磁盘次数/Memstore flush 写磁盘次数
flushQueueLengthRegion Flush 队列长度
flushedCellsSizeflush到磁盘大小
storeFileCountStorefile 个数
storeCountStore 个数
storeFileSizeStorefile 大小
compactionQueueLengthCompaction 队列长度
percentFilesLocalRegion 的 HFile 位于本地 HDFS Data Node的比例
percentFilesLocalSecondaryRegionsRegion 副本的 HFile 位于本地 HDFS Data Node的比例
hlogFileCountWAL 文件数量
hlogFileSizeWAL 文件大小

指标集合:IPC

指标名称指标单位指标帮助描述
numActiveHandler当前的 RIT 数量
NotServingRegionException超过阈值的 RIT 数量
RegionMovedExceptionms最老的RIT的持续时间
RegionTooBusyExceptionms最老的RIT的持续时间

指标集合:JVM

指标名称指标单位指标帮助描述
MemNonHeapUsedM当前活跃RegionServer列表
MemNonHeapCommittedM当前离线RegionServer列表
MemHeapUsedMZookeeper列表
MemHeapCommittedMMaster节点
MemHeapMaxM集群负载均衡次数
MemMaxMRPC句柄数
GcCountMB集群接收数据量