TKE 事件日志告警
Kubenretes 事件日志
Kubenretes 的资源会产生事件日志,分 Normal 和 Warning 两类,其中 Normal 类型是一般的事件日志,比如 Pod 调度成功,拉取镜像等;Warning 类型是异常事件日志,比如 Pod 启动失败,Node 磁盘紧张等。
事件日志是 Kubernetes 提供的标准接口,除了 Kubernetes 自身组件会产生事件日志外,其它组件也可以通过相同方式发送事件日志给 Kubernetes 集群,比如 cert-manager:
采集事件日志
TKE 支持一键开启事件日志采集,将 Kubernetes 事件日志采集到 CLS 中进行存储、检索和告警,详情请参考 集群运维:事件日志。
配置事件日志告警
通常我们重点关注 Warning 类型的日志,可以统一配置事件日志告警。
操作步骤:
- 在 告警策略 页面单击新建。
- 监控对象 选择 TKE 集群事件日志的日志主题。
- 执行语句 填写
event.type:Warning
。 - 附加通知内容:
{{- range .QueryLog }}
集群 cls-xxxxxxxx 发生异常事件:
{{- range . }}
{{.content.event.reason}} {{ .content.event.involvedObject.kind }}/{{ .content.event.involvedObject.name }} {{ .content.event.message }}
{{- end}}
{{- end}}
注意替换下集群 ID。
其余配置项可按需配置。