监控:Ubuntu操作系统监控
对Ubuntu操作系统的通用性能指标进行采集监控。
配置参数
参数名称 | 参数帮助描述 |
---|---|
监控Host | 被监控的对端IPV4,IPV6或域名。注意⚠️不带协议头(eg: https://, http://)。 |
任务名称 | 标识此监控的名称,名称需要保证唯一性。 |
端口 | Linux SSH对外提供的端口,默认为22。 |
超时时间 | 设置连接的超时时间,单位ms毫秒,默认6000毫秒。 |
复用连接 | 设置SSH连接是否复用,默认为:false。为false每次获取信息都会创建一个连接 |
使用代理 | 设置是否通过代理连接,默认为false。 |
用户名 | SSH连接用户名,可选 |
密码 | SSH连接密码,可选 |
采集器 | 配置此监控使用哪台采集器调度采集 |
监控周期 | 监控周期性采集数据间隔时间,单位秒,可设置的最小间隔为30秒 |
绑定标签 | 用于对监控资源进行分类管理 |
描述备注 | 更多标识和描述此监控的备注信息,用户可以在这里备注信息 |
私钥 | 连接服务器所需的私钥 |
密钥短语 | 用于加密 SSH 私钥的密码短语(Passphrase)。如果私钥在生成时设置了密码短语,则必须填写此字段才能解密并使用私钥进行认证。 |
代理主机 | 代理服务器的地址,支持 IPV4、IPV6或域名。若使用 SSH 代理跳转访问目标主机,需填写代理服务器的地址。 |
代理端口 | 代理服务器的端口号。 |
代理用户名 | 连接代理服务器时所需的认证用户名。 |
代理密码 | 连接代理服务器时所需的认证密码。 |
代理主机私钥 | 连接代理服务器时所需的私钥。 |
采集指标
指标集合:系统基本信息
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
hostname | 无 | 主机名称 |
version | 无 | 操作系统版本 |
uptime | 无 | 启动时间 |
指标集合:CPU 信息
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
info | 无 | CPU型号 |
cores | 无 | CPU内核数量 |
interrupt | 无 | CPU中断数量 |
load | 无 | CPU最近1/5/15分钟的平均负载 |
context_switch | 无 | 当前上下文切换数量 |
usage | % | CPU使用率 |
指标集合:内存信息
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
total | Mb | 总内存容量 |
used | Mb | 用户程序内存量 |
free | Mb | 空闲内存容量 |
buff_cache | Mb | 缓存占用内存 |
available | Mb | 剩余可用内存容量 |
usage | % | 内存使用率 |
指标集合:磁盘信息
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
disk_num | 无 | 磁盘总数 |
partition_num | 无 | 分区总数 |
block_write | 无 | 写入磁盘的总块数 |
block_read | 无 | 从磁盘读出的块数 |
write_rate | iops | 每秒写磁盘块的速率 |
指标集合:网卡信息
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
interface_name | 无 | 网卡名称 |
receive_bytes | Byte | 入站数据流量(bytes) |
transmit_bytes | Byte | 出站数据流量(bytes) |
指标集合:文件系统
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
filesystem | 无 | 文件系统的名称 |
used | Mb | 已使用磁盘大小 |
available | Mb | 可用磁盘大小 |
usage | % | 使用率 |
mounted | 无 | 挂载点目录 |
指标集合:Top10 CPU进程
统计进程使用CPU的Top10进程。统计信息包括:进程ID、CPU占用率、内存占用率、执行命令。
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
pid | 无 | 进程ID |
cpu_usage | % | CPU占用率 |
mem_usage | % | 内存占用率 |
command | 无 | 执行命令 |
指标集合:Top10 内存进程
统计进程使用内存的Top10进程。统计信息包括:进程ID、内存占用率、CPU占用率、执行命令。
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
pid | 无 | 进程ID |
mem_usage | % | 内存占用率 |
cpu_usage | % | CPU占用率 |
command | 无 | 执行命令 |
其他指标集合:所有核心的平均CPU温度
指标名称 | 指标单位 | 指标帮助描述 |
---|---|---|
avg_cpu_temp | C | 所有核心的平均温度 |
- 注意:此指标信息依赖硬件传感器的监测工具(lm-sensors),请确认Ubuntu操作系统可以正常获取监测信息,可根据需要补充如下指标采集配置
metrics:
- name: avg_cpu_temp
i18n:
zh-CN: 所有核心的平均CPU温度
en-US: Average CPU Temperature Across All Cores
priority: 4
fields:
- field: avg_cpu_temp
type: 1
label: true
unit: 'C'
i18n:
zh-CN: 所有核心的平均温度
en-US: Average Temp All Cores
protocol: ssh
ssh:
host: ^_^host^_^
port: ^_^port^_^
username: ^_^username^_^
password: ^_^password^_^
privateKey: ^_^privateKey^_^
privateKeyPassphrase: ^_^privateKeyPassphrase^_^
timeout: ^_^timeout^_^
reuseConnection: ^_^reuseConnection^_^
script: sensors | grep "^Core\s[0-9\d+\:]" | awk '{print $3}' | sed "s/°C/\ /g" | awk '{ total += $1; count++ } END { print total/count }'
parseType: oneRow
# whether to use proxy server for ssh connection
useProxy: ^_^useProxy^_^
# ssh proxy host: ipv4 domain
proxyHost: ^_^proxyHost^_^
# ssh proxy port
proxyPort: ^_^proxyPort^_^
# ssh proxy username
proxyUsername: ^_^proxyUsername^_^
# ssh proxy password
proxyPassword: ^_^proxyPassword^_^
# ssh proxy private key
proxyPrivateKey: ^_^proxyPrivateKey^_^