阈值告警配置
对监控指标配置告警阈值(警告告警,严重告警,紧急告警),系统根据阈值配置和采集指标数据计算触发告警。
操作步骤
1. 监控服务设置标签(可选)
如果您需要对告警进行分类,可以对监控的目标设置标签。如:您有多个Linux系统需要监控,并且每个系统监控指标不同,比如:A服务器可用内存大于1G,B服务器可用内存大于2G,那么您可以为A服务器和B服务器分别设置标签,然后针对标签进行告警配置。
创建标签
依次点击 标签管理 -> 新增标签
如上图所示,新增标签,这里我们设置标签为: linux:dev (开发环境使用Linux)
配置标签
TODO 图片名称更新
如上图所示,我们点击新增标签
选择我们的标签,这里演示选择linux:dev
标签
创建阈值规则
依次点击 【阈值规则】->【新增阈值规则】-> 【配置后确定】
上图配置具体说明:
- 指标对象:选择我们需要配置阈值的监控指标对象 例如:网站监控类型下的 -> summary指标集合下的 -> responseTime响应时间指标
- 阈值规则:根据此表达式来计算判断是否触发阈值,表达式环境变量和操作符见页面提示,例如:设置响应时间大于50触发告警,表达式为
responseTime > 50
。阈值表达式详细帮助见 阈值表达式帮助 - 告警级别:触发阈值的告警级别,从低到高依次为:警告-warning,严重-critical,紧急-emergency
- 触发次数:设置触发阈值多少次之后才会真正的触发告警
- 通知模版:告警触发后发送的通知信息模版,模版环境变量见页面提示,例如:
${app}.${metrics}.${metric}指标的值为${responseTime},大于50触发告警
- 绑定标签:选择我们需要应用的标签,如果不选择标签则会应用到设置指标对象对应的所有服务上。
- 应用全局:设置此阈值是否对全局的此类指标都应用有效,默认否。新增阈值后还需将阈值与监控对象关联,这样阈值才会对此监控生效。
- 恢复通知:告警触发后是否发送恢复通知,默认不发送。
- 启用告警:此告警阈值配置开启生效或关闭
阈值告警配置完毕,已经被成功触发的告警信息可以在【告警中心】看到。 若需要将告警信息邮件,微信,钉钉飞书通知给相关人员,可以在【告警通知】配置。
其它问题可以通过交流群ISSUE反馈哦!