语音/文本转换

组件概述

语音/文本转换组件提供语音与文本之间的双向转换功能，支持将文本转换为语音文件或将音频文件转换为可编辑的文本内容。

配置说明

语音/文本转换服务URL

作用：指定语音/文本转换服务的API接口地址
示例：https://your-audio-text-api-endpoint.com

操作类型

选择语音与文本的转换方向：

文本转语音

将文本内容转换为语音文件

文本内容：输入要转换为语音的文本，支持使用变量 {{variables.varName}}
语音类型（可选）：指定语音合成的声音类型
- 示例：zh-CN-XiaoxiaoNeural, en-US-JennyNeural
语速（可选）：设置语音播放速度，默认值为 1.0

语音转文本

将音频文件转换为文本内容

音频文件选择：手动上传音频文件
音频文件路径（可选）：通过路径指定音频文件
- 示例：/path/to/audio.mp3 或 @audioPath
音频base64变量名（可选）：通过变量传递base64编码的音频数据
- 示例：audioData 或 @audioDataVariable
语言（可选）：指定音频的语言类型
- 示例：zh-CN, en-US

数据输出

分配给变量

将转换结果保存到变量中

变量名称：指定存储转换结果的变量名称

插入表格

将转换结果插入到表中

选择列：指定插入转换结果的表格列

使用说明

文本转语音：将文本内容转换为语音文件，支持多种语音类型和语速调节
语音转文本：将音频文件转换为文本内容，支持多种音频格式和语言识别
优先级：手动上传 > 文件路径 > base64变量
支持的音频格式：MP3、WAV、M4A、FLAC、AAC

应用场景

语音提示和播报系统
会议录音转文字记录
语音指令识别处理
多媒体内容自动化处理

注意事项

确保语音转换服务正常运行
音频质量直接影响语音识别准确率
长文本转语音时注意服务的时间限制
建议对重要语音识别结果进行人工校对