Skip to content

Latest commit

 

History

History
32 lines (15 loc) · 1023 Bytes

alert_policies.md

File metadata and controls

32 lines (15 loc) · 1023 Bytes

CITA Monitor 监控告警策略

告警类别

  • 服务进程状态告警,如各微服务、依赖服务进程存活

    • CITA 各微服务进程存活:进程失活、恢复

    • rabbitmq 服务进程存活:进程失活、恢复

    • CITA Monitor Agent 服务进程存活:进程失活、恢复

  • 区块链数据状态告警,如出块高度、出块间隔时间

    • 停止出块:出块高度在设置告警阈值内没有变化

    • 出块间隔过久:出块间隔大于设置告警阈值

    • EVM CPU 过载警告:Quota Used / Block Limit 占比持续时间大于设置阈值

    • 共识节点是否出块:共识节点是否有参与共识,超过告警设置时间则发送错误告警

  • 运行环境状态告警,如磁盘空间不足

    • 磁盘空间不足:剩余磁盘空间小于告警阈值(默认为10%)

    • 目录增长过快:数据目录增长速度大于设置告警阈值

    • 主机 CPU 过载警告:CPU 使用率持续时间大于设置阈值