Appearance
语音/文本转换
组件概述
语音/文本转换组件提供语音与文本之间的双向转换功能,支持将文本转换为语音文件或将音频文件转换为可编辑的文本内容。
配置说明
语音/文本转换服务URL
- 作用:指定语音/文本转换服务的API接口地址
- 示例:
https://your-audio-text-api-endpoint.com
操作类型
选择语音与文本的转换方向:
文本转语音
将文本内容转换为语音文件
- 文本内容:输入要转换为语音的文本,支持使用变量
{{variables.varName}} - 语音类型(可选):指定语音合成的声音类型
- 示例:
zh-CN-XiaoxiaoNeural,en-US-JennyNeural
- 示例:
- 语速(可选):设置语音播放速度,默认值为
1.0
语音转文本
将音频文件转换为文本内容
- 音频文件选择:手动上传音频文件
- 音频文件路径(可选):通过路径指定音频文件
- 示例:
/path/to/audio.mp3或@audioPath
- 示例:
- 音频base64变量名(可选):通过变量传递base64编码的音频数据
- 示例:
audioData或@audioDataVariable
- 示例:
- 语言(可选):指定音频的语言类型
- 示例:
zh-CN,en-US
- 示例:
数据输出
分配给变量
将转换结果保存到变量中
- 变量名称:指定存储转换结果的变量名称
插入表格
将转换结果插入到表中
- 选择列:指定插入转换结果的表格列
使用说明
- 文本转语音:将文本内容转换为语音文件,支持多种语音类型和语速调节
- 语音转文本:将音频文件转换为文本内容,支持多种音频格式和语言识别
- 优先级:手动上传 > 文件路径 > base64变量
- 支持的音频格式:MP3、WAV、M4A、FLAC、AAC
应用场景
- 语音提示和播报系统
- 会议录音转文字记录
- 语音指令识别处理
- 多媒体内容自动化处理
注意事项
- 确保语音转换服务正常运行
- 音频质量直接影响语音识别准确率
- 长文本转语音时注意服务的时间限制
- 建议对重要语音识别结果进行人工校对
MakAgent在线文档