机器人本身提供了基础的故障诊断和健康监测的能力,能够对一些基本的异常和故障进行监控,例如关节过温、传感器失效、系统占用持续过高、电池电量过低等。
如果需要持续监控机器人的异常状态,建议每隔一段时间查询一次当前的告警列表(频率不要太高,推荐 0.2 Hz 及以下的频率)。
全量故障和告警可在 MDU 机上 /agibot/software/v0/config/hds/database/exception_info.yaml 文件中找到。
| 接口名 |
pb:/aimdk.protocol.HDSService/GetAlertList |
| 功能概述 |
获取当前告警列表 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://10.42.10.12:50587/rpc/aimdk.protocol.HDSService/GetAlertList |
| 入参 |
{}
|
出参
|
{
"data": {
"alerts": [
{
"id": "c39f6ccc-85d9-4976-a2e9-08f2906cc237",
"appeared_timestamp": "1762933137153",
"disappeared_timestamp": "0",
"alert_code": "A2000003",
"state": "AlertState_ACTIVE",
"description": "急停拍下",
"level": "AlertLevel_H5_STATUS",
"alert_text": {
"zh_CN": "急停拍下",
"en_US": "Emergency Stop Triggered"
},
"alert_module": {
"zh_CN": "monitor",
"en_US": "健康管理HDS"
}
}
]
}
}
-
id: 本条告警 id
-
appeared_timestamp: 告警出现的时间戳
-
disappeared_timestamp: 告警消失的时间戳
-
alert_code: 告警码
-
state: 告警状态
- AlertState_UNDEFINED: 未知
- AlertState_ACTIVE: 告警中
- AlertState_CLEARED: 已清除
-
description: 告警描述
-
level: 告警等级
- AlertLevel_UNDEFINED: 无告警
- AlertLevel_H1_FATAL: 机器人发生不可逆异常,无法继续工作
- AlertLevel_H2_CRITICAL: 机器人发生故障,有摔倒风险
- AlertLevel_H2_PERMANENT: 机器人发生不可逆异常,部分功能已经停用
- AlertLevel_H3_ERROR: 机器人发生故障,有摔倒风险
- AlertLevel_H3_PERMANENT: 机器人发生不可逆异常,影响部分功能体验
- AlertLevel_H4_WARNING: 机器人发生故障,影响部分功能体验
- AlertLevel_H4_EVENT: 机器人状态不佳,有摔倒风险
- AlertLevel_H5_EVENT: 机器人状态不佳,影响部分功能体验
- AlertLevel_H5_TRIVIAL: 机器人发生故障,可能影响部分功能体验
- AlertLevel_H5_STATUS: 不提示
- AlertLevel_H6_RESERVE: 灰度发布
- AlertLevel_H7_EVENT: 正常功能
- AlertLevel_H7_DELETE: 非故障事件
-
alert_text: 客户端告警文案,支持多语言
-
alert_module: 故障上报模块,支持多语言
|
| 示例脚本 |
examples/hds/get_alert_list.sh |
| 备注 |
|
除上述 GetAlertList 接口外,还有如下接口开放
-
GetTotalAlertList :获取系统中所有告警,包含历史信息
-
GetAlertCount:获取系统中当前存在的所有告警个数
-
GetExceptionEvent:获取系统中的故障事件
但以上接口获取信息过于冗杂或使用不方便,推荐仅使用 GetAlertList 接口进行基本告警信息的获取操作,以上各个开放接口均有示例位于 examples/hds 目录下,不详细展示其出入参等。