跳到主要内容
版本:v1.5.x

监控 NebulaGraph 数据库

收集和监控 NebulaGraph 的常规性能指标。

使用协议:nebulaGraph

监控分为两个部分,nebulaGraph_stats 和 rocksdb_stats。
nebulaGraph_stats 是 NebulaGraph 的统计信息,rocksdb_stats 是 RocksDB 的统计信息。

1、通过 stats 和 rocksdb stats 接口获取可用参数。

1.1、如果只需要获取 nebulaGraph_stats,需要确保可以访问 stats,否则会出现错误。

默认端口是 19669,访问地址为 http://ip:19669/stats

1.2、如果需要获取 rocksdb stats 的附加参数,需要确保可以访问 rocksdb stats,否则会报错。

首次连接 NebulaGraph 时,必须先注册 Storage 服务,以便正确查询数据。

有帮助文档:https://docs.nebula-graph.com.cn/3.4.3/4.deployment-and-installation/connect-to-nebula-graph/

https://docs.nebula-graph.com.cn/3.4.3/2.quick-start/3.quick-start-on-premise/3.1add-storage-hosts/

默认端口是 19779,访问地址为:http://ip:19779/rocksdb_stats

配置参数

参数名称参数帮助描述
监控主机被监控的 IPV4、IPV6 或域名。注意⚠️没有协议头(例如:https://、http://)
监控名称识别此监控的名称。名称需要唯一
graphPortNebula Graph 提供的 Graph 服务的端口
timePeriod可以是 5 秒、60 秒、600 秒或 3600 秒,分别表示最近 5 秒、最近 1 分钟、最近 10 分钟和最近 1 小时的时间段
storagePortNebula Graph 提供的 Storage 服务的端口
超时允许收集响应时间
收集间隔监控周期性数据收集的间隔时间,单位:秒,最小可设置的间隔为 30 秒
是否检测是否检测和验证添加监控之前的可用性。只有检测成功后,添加和修改操作才会继续进行
描述备注用于识别和描述此监控的更多信息,用户可以在此处记录信息

收集指标

指标集:nebulaGraph_stats

指标太多,相关链接如下 https://docs.nebula-graph.com.cn/3.4.3/6.monitor-and-metrics/1.query-performance-metrics/

指标名称指标单位指标帮助描述
达到内存水位线的语句的数量(rate)
达到内存水位线的语句的数量(sum)
服务端主动回收的过期的会话数量(rate)
服务端主动回收的过期的会话数量(sum)
慢查询延迟时间(avg)
慢查询延迟时间(p75)
慢查询延迟时间(p95)
慢查询延迟时间(p99)
慢查询延迟时间(p999)
查询延迟时间(avg)
查询延迟时间(p75)
查询延迟时间(p95)
查询延迟时间(p99)
查询延迟时间(p999)
因用户名密码错误导验证失败的会话数量(rate)
因用户名密码错误导验证失败的会话数量(sum)
查询次数(rate)
查询次数(sum)
排序(Sort)算子执行时间(rate)
排序(Sort)算子执行时间(sum)
Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量(rate)
Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量(sum)
登录验证失败的会话数量(rate)
登录验证失败的会话数量(sum)
查询报错语句数量(rate)
查询报错语句数量(sum)
被终止的查询数量(rate)
被终止的查询数量(sum)
因查询错误而导致的 Leader 变更的次数(rate)
因查询错误而导致的 Leader 变更的次数(sum)
Graphd 服务发给 Metad 服务的 RPC 请求数量(rate)
Graphd 服务发给 Metad 服务的 RPC 请求数量(sum)
慢查询次数(rate)
慢查询次数(sum)
活跃的会话数的变化数(sum)
活跃的查询语句数的变化数(sum)
Graphd 服务接收的语句数(rate)
Graphd 服务接收的语句数(sum)
聚合(Aggregate)算子执行时间(rate)
聚合(Aggregate)算子执行时间(sum)
优化器阶段延迟时间(avg)
优化器阶段延迟时间(p75)
优化器阶段延迟时间(p95)
优化器阶段延迟时间(p99)
优化器阶段延迟时间(p999)
Graphd 服务发给 Metad 的 RPC 请求失败的数量(rate)
Graphd 服务发给 Metad 的 RPC 请求失败的数量(sum)
索引扫描(IndexScan)算子执行时间(rate)
索引扫描(IndexScan)算子执行时间(sum)
服务端建立过的会话数量(rate)
服务端建立过的会话数量(sum)
因为超过FLAG_OUT_OF_MAX_ALLOWED_CONNECTIONS参数导致的验证登录的失败的会话数量(rate)
因为超过FLAG_OUT_OF_MAX_ALLOWED_CONNECTIONS参数导致的验证登录的失败的会话数量(sum)
Graphd 服务发给 Storaged 服务的 RPC 请求数量(rate)
Graphd 服务发给 Storaged 服务的 RPC 请求数量(sum)

指标集:rocksdb_stats

指标太多,相关链接如下 https://docs.nebula-graph.com.cn/3.4.3/6.monitor-and-metrics/2.rocksdb-statistics/

指标名称指标单位指标帮助描述
rocksdb.backup.read.bytes备份 RocksDB 数据库期间读取的字节数
rocksdb.backup.write.bytes指标名称
......