A2 机器人配有扬声器,在有网络的情况下可以进行 TTS 播报,无网络时可以进行基本的音频文件播放和音量调节,同时可以支持队列播放、播放状态查询以及打断等控制逻辑。
| 接口名 |
pb:/aimdk.protocol.TTSService/PlayTTS |
| 功能概述 |
TTS 播报接口,依赖联网 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://192.168.100.110:59301/rpc/aimdk.protocol.TTSService/PlayTTS |
| 入参 |
{
"text": "你好",
"priority_level": "INTERACTION_L6",
"domain": "example",
"trace_id": "hafhjkqwjwefk",
"is_interrupted": true
}
- text: 播报文本内容
- priority_level: 优先级,保持 INTERACTION_L6 即可
- domain: 调用方来源标识,可以传入自定义的客户端字符串,方便问题排查等
- trace_id: 播报 id,如果需要获取播报状态,则需要传入该字段,并将其值作为查询播报状态的参数
- is_interrupted: 是否打断同等优先级播报,请默认传 true,有队列播报的需求可以使用 false
|
| 出参 |
{
"text": "你好",
"priority_level": "INTERACTION_L6",
"priority_weight": 0,
"domain": "example",
"trace_id": "hafhjkqwjwefk_18bZZLTk5VfJGSy8Cylsu4",
"is_sucess": true,
"error_message": "",
"estimated_duration": 0a
}
- text: 播报文本内容
- priority_level: 优先级等级,无需关注
- pritority_weight: 优先级权重,无需关注
- domain: 调用方来源标识,返回请求中传入的自定义字符串,方便问题排查
- trace_id: 播报 id,返回请求中传入的自定义字符串 + 一段随机字符串,用于播报状态查询等
- is_success: 优先级校验是否成功,一般均为 true,不代表会播放,例如传入错误或不存在的文件名仍会返回 true,只有当前有更高优先级的内容播报时才会返回 true,例如当前有故障报警播报时
- error_message: 错误信息
- estimated_duration: 无效字段,无需关注,无法估算播放时长
|
| 示例脚本 |
examples/agent/tts_broadcast.sh |
| 备注 |
- 只支持 短文本请求,最高只 1024 字节,约 200 个中文/英文
- 端口号 59201 仍可以使用,会自动转发到 59301
|
| 接口名 |
pb:/aimdk.protocol.TTSService/PlayMediaFile |
| 功能概述 |
音频文件播放 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://192.168.100.110:59301/rpc/aimdk.protocol.TTSService/PlayMediaFile |
| 入参 |
{
"file_name": "wake.pcm",
"priority_level": "INTERACTION_L6",
"domain": "example",
"trace_id": "hafhjkqwjwefk",
"is_interrupted": true
}
- file_name: 文件名(支持传入相对路径或绝对路径,若使用相对路径,默认从 ORIN
/agibot/data/var/hal_audio/file读取,例如可传入 wake.pcm;若使用绝对路径,例如可传入 /agibot/data/home/agi/Desktop/wake.pcm,按指定路径读取;文件要求为 24kHz 16 位 单声道的 pcm 文件)
- priority_level: 优先级,保持 INTERACTION_L6 即可
- domain: 调用方来源标识,可以传入自定义的客户端字符串,方便问题排查等
- trace_id: 播报 id,如果需要获取播报状态,则需要传入该字段,并将其值作为查询播报状态的参数
- is_interrupted: 是否打断同等优先级播报,请默认传 true,有队列播报的需求可以使用 false
|
| 出参 |
{
"text": "wake.pcm",
"priority_level": "INTERACTION_L6",
"priority_weight": 0,
"domain": "example",
"trace_id": "hafhjkqwjwefk",
"is_sucess": true,
"error_message": "",
"estimated_duration": 0
}
- text: 文件名
- priority_level: 优先级等级,无需关注
- pritority_weight: 优先级权重,无需关注
- domain: 调用方来源标识,返回请求中传入的自定义字符串,方便问题排查
- trace_id: 播报 id,返回请求中传入的自定义字符串,用于请求播报状态或打断
- is_success: 优先级校验是否成功,一般均为 true,不代表会播放,例如传入错误或不存在的文件名仍会返回 true,只有当前有更高优先级的内容播报时才会返回 true,例如当前有故障报警播报时
- error_message: 错误信息
- estimated_duration: 无效字段,无需关注,无法估算播放时长
|
| 示例脚本 |
examples/agent/play_media_file.sh |
| 备注 |
- 同时支持标准 44 字节头部 Linear PCM 的 wav 文件,其余头部格式以及压缩格式等均不支持,推荐使用 24kHz 16 位单声道的 pcm 文件
- 如果传入错误或不存在的文件名,会静默失败,不会进行播放,同时 is_success 返回 true
- 端口号 59201 仍可以使用,会自动转发到 59301
|
| 接口名 |
pb:/aimdk.protocol.TTSService/GetAudioStatus |
| 功能概述 |
TTS/音频文件播放状态查询 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://192.168.100.110:59301/rpc/aimdk.protocol.TTSService/GetAudioStatus |
| 入参 |
{
"trace_id": "hafhjkqwjwefk"
}
- trace_id: 播报 id,填写调用 PlayMediaFile 接口时传入的自定义 id
|
| 出参 |
{
"tts_status": {
"text": "",
"priority": 0,
"trace_id": "",
"tts_status": "TTSStatusType_Playing",
"domain": "",
"error_message": ""
}
}
-
tts_status: 播报状态,枚举值
- TTSConfigStatusType_Unknown: 未知状态
- TTSStatusType_Begin: 开始播报,短暂,一般查询不到这个状态
- TTSStatusType_Playing: 播报中
- TTSStatusType_End: 播报结束,短暂,一般查询不到这个状态
- TTSStatusType_Stop: 暂停播报/取消播报/中断播报
- TTSStatusType_Error: 播报失败
- TTSStatusType_InQue: 在播报队列中,尚未开始播报
- TTSStatusType_NOTInQue: 播报队列无此文本,也不在播报,播报结束后会进入此状态
-
其余字段均为无效字段,无需关注
|
| 示例脚本 |
examples/agent/tts_status_rpc.sh |
| 备注 |
- 成功的播报通过该 RPC 接口查询一般会返回 InQue、Playing 和 NOTInQue 状态
- 端口号 59201 仍可以使用,会自动转发到 59301
|
| 接口名 |
/interaction/tts_status |
| 功能概述 |
TTS/音频文件播放状态 |
| 接口类型 |
ROS2 Topic |
| 出参 |
{
"text": "你好",
"priority": 600,
"trace_id": "hafhjkqwjwefk_5WC7uy69bqCuO101aalJ1T",
"tts_status": "TTSStatusType_End",
"domain": "example",
"header": {
"seq": 110
}
}
-
text: 文件名
-
trace_id:播报 id
-
domain:调用方来源
-
tts_status: 播报状态,枚举值
- TTSConfigStatusType_Unknown: 未知状态
- TTSStatusType_Begin: 开始播报,短暂,一般查询不到这个状态
- TTSStatusType_Playing: 播报中
- TTSStatusType_End: 播报结束,短暂,一般查询不到这个状态
- TTSStatusType_Stop: 暂停播报/取消播报/中断播报
- TTSStatusType_Error: 播报失败
- TTSStatusType_InQue: 在播报队列中,尚未开始播报
- TTSStatusType_NOTInQue: 播报队列无此文本,也不在播报,播报结束后会进入此状态
-
其余字段均为无效字段,无需关注
|
| 示例脚本 |
examples/agent/tts_status_topic.py |
| 备注 |
- 该消息的 ROS2 类型为 ros2_plugin_proto/msg/RosMsgWrapper,需要 source prebuilt/ros2_plugin_proto_aarch64/share/ros2_plugin_proto/local_setup.bash 后使用。
- 该接口需要将交互运行模式设置为 normal 或 voice_face 模式才会发布,only_voice 模式下无消息
|
我们提供了单个文件播放打断接口和整个播报队列清空接口。
| 接口名 |
pb:/aimdk.protocol.TTSService/StopTTSTraceId |
| 功能概述 |
打断单个 文件/TTS 播放 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://192.168.100.110:59301/rpc/aimdk.protocol.TTSService/StopTTSTraceId |
| 入参 |
{
"trace_id": "hafhjkqwjwefk"
}
- trace_id: 播报 id,填写调用 PlayMediaFile 接口时传入的自定义 id
|
| 出参 |
{
"state":"CommonState_UNKNOWN"
}
- state: 调用请求状态,无需关注具体值,HTTP 请求返回 200 即代表成功
|
| 示例脚本 |
examples/agent/stop_tts.sh |
| 备注 |
- 端口号 59201 仍可以使用,会自动转发到 59301
|
| 接口名 |
pb:/aimdk.protocol.TTSService/StopTTS |
| 功能概述 |
终止所有 TTS/音频文件 播放,包括当前播放任务和所有队列中的任务 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://192.168.100.110:59301/rpc/aimdk.protocol.TTSService/StopTTS |
| 入参 |
{}
- trace_id: 播报 id,填写调用 PlayMediaFile 接口时传入的自定义 id
|
| 出参 |
{
"state":"CommonState_UNKNOWN"
}
- state: 调用请求状态,无需关注具体值,HTTP 请求返回 200 即代表成功
|
| 示例脚本 |
examples/agent/stop_all_tts.sh |
| 备注 |
- 端口号 59201 仍可以使用,会自动转发到 59301
|
| 接口名 |
pb:/aimdk.protocol.HalAudioService/GetAudioVolume |
| 功能概述 |
获取当前音量大小 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://192.168.100.110:56666/rpc/aimdk.protocol.HalAudioService/GetAudioVolume |
| 入参 |
{}
|
| 出参 |
{
"header": {
"code": "0",
"msg": "GetAudioVolume successfully",
"trace_id": "",
"domin": ""
},
"audio_volume": 30,
"is_mute": false,
"type": "SPEAKRE_BUILT_IN"
}
|
| 示例脚本 |
examples/hal_audio/GetAudioVolume.sh |
| 备注 |
|
| 接口名 |
pb:/aimdk.protocol.HalAudioService/SetAudioVolume |
| 功能概述 |
调节音量 |
| 接口类型 |
HTTP JSON RPC |
| URL |
http://192.168.100.110:56666/rpc/aimdk.protocol.HalAudioService/SetAudioVolume |
| 入参 |
{
"audio_volume": 70,
"is_mute": false,
"type"
}
- audio_volume: 音量大小,0-100 的数值,注意不要调节音量超过 70,音量超出此范围扬声器经功放放大后会超额定工作,造成扬声器损坏
- is_mute: 是否静音
|
| 出参 |
{
"header": {
"code": "0",
"msg": "SetAudioVolume successfully",
"trace_id": "",
"domin": ""
},
"pkg_name": "",
"is_success": false
}
- pkg_name: 无效字段,无需关注
- is_success: 无效字段,无需关注
|
| 示例脚本 |
examples/hal_audio/SetAudioVolume.sh |
| 备注 |
- 如需静音,请将 audio_volume 字段设为 0,is_mute 设为 true。
|
如果不想使用上述 agent 提供的音频播放能力(底层会调用 hal_audio 提供的原子能力),而希望自行使用扬声器使用底层库如 pyaudio/alsasound 等自行进行音频播放,需要关闭 hal_audio 模块,方法如下:
-
备份 ORIN 上的 /agibot/software/v0/entry/bin/cfg/run_agibot.yaml
cp /agibot/software/v0/entry/bin/cfg/run_agibot.yaml /agibot/software/v0/entry/bin/cfg/run_agibot.yaml.original
-
修改其中 default_apps 部分,移除 hal_audio 模块,然后重启机器人。

重启后可使用下面的设备进行播放,程序调用请自行实现,音频声道、逻辑设备等配置可查看 ORIN 上 /etc/asound.conf 文件。
aplay -D multiplay_def -c 1 -r 24000 -f S16_LE /agibot/data/var/interaction/audio/wake.pcm
注意:机器人扬声器音量设置不得超过 70%,音量超出此范围扬声器经功放放大后会超额定工作,造成扬声器损坏