跳到主要内容
版本:v1.6.x

阈值告警配置

对监控指标配置告警阈值(警告告警,严重告警,紧急告警),系统根据阈值配置和采集指标数据计算触发告警。

操作步骤

1. 监控服务设置标签(可选)

如果您需要对告警进行分类,可以对监控的目标设置标签。如:您有多个Linux系统需要监控,并且每个系统监控指标不同,比如:A服务器可用内存大于1G,B服务器可用内存大于2G,那么您可以为A服务器和B服务器分别设置标签,然后针对标签进行告警配置。

创建标签

依次点击 标签管理 -> 新增标签

threshold

如上图所示,新增标签,这里我们设置标签为: linux:dev (开发环境使用Linux)

配置标签

TODO 图片名称更新 threshold

如上图所示,我们点击新增标签

threshold

选择我们的标签,这里演示选择linux:dev标签

创建阈值规则

依次点击 【阈值规则】->【新增阈值规则】-> 【配置后确定】

threshold

上图配置具体说明:

  • 指标对象:选择我们需要配置阈值的监控指标对象 例如:网站监控类型下的 -> summary指标集合下的 -> responseTime响应时间指标
  • 阈值规则:根据此表达式来计算判断是否触发阈值,表达式环境变量和操作符见页面提示,例如:设置响应时间大于50触发告警,表达式为 responseTime > 50。阈值表达式详细帮助见 阈值表达式帮助
  • 告警级别:触发阈值的告警级别,从低到高依次为:警告-warning,严重-critical,紧急-emergency
  • 触发次数:设置触发阈值多少次之后才会真正的触发告警
  • 通知模版:告警触发后发送的通知信息模版,模版环境变量见页面提示,例如:${app}.${metrics}.${metric}指标的值为${responseTime},大于50触发告警
  • 绑定标签:选择我们需要应用的标签,如果不选择标签则会应用到设置指标对象对应的所有服务上。
  • 应用全局:设置此阈值是否对全局的此类指标都应用有效,默认否。新增阈值后还需将阈值与监控对象关联,这样阈值才会对此监控生效。
  • 恢复通知:告警触发后是否发送恢复通知,默认不发送。
  • 启用告警:此告警阈值配置开启生效或关闭

阈值告警配置完毕,已经被成功触发的告警信息可以在【告警中心】看到。 若需要将告警信息邮件,微信,钉钉飞书通知给相关人员,可以在【告警通知】配置。

其它问题可以通过交流群ISSUE反馈哦!