Skip to content

语音/文本转换

组件概述

语音/文本转换组件提供语音与文本之间的双向转换功能,支持将文本转换为语音文件或将音频文件转换为可编辑的文本内容。

配置说明

语音/文本转换服务URL

  • 作用:指定语音/文本转换服务的API接口地址
  • 示例https://your-audio-text-api-endpoint.com

操作类型

选择语音与文本的转换方向:

文本转语音

将文本内容转换为语音文件

  • 文本内容:输入要转换为语音的文本,支持使用变量 {{variables.varName}}
  • 语音类型(可选):指定语音合成的声音类型
    • 示例zh-CN-XiaoxiaoNeural, en-US-JennyNeural
  • 语速(可选):设置语音播放速度,默认值为 1.0

语音转文本

将音频文件转换为文本内容

  • 音频文件选择:手动上传音频文件
  • 音频文件路径(可选):通过路径指定音频文件
    • 示例/path/to/audio.mp3@audioPath
  • 音频base64变量名(可选):通过变量传递base64编码的音频数据
    • 示例audioData@audioDataVariable
  • 语言(可选):指定音频的语言类型
    • 示例zh-CN, en-US

数据输出

分配给变量

将转换结果保存到变量

  • 变量名称:指定存储转换结果的变量名称

插入表格

将转换结果插入到

  • 选择列:指定插入转换结果的表格列

使用说明

  • 文本转语音:将文本内容转换为语音文件,支持多种语音类型和语速调节
  • 语音转文本:将音频文件转换为文本内容,支持多种音频格式和语言识别
  • 优先级:手动上传 > 文件路径 > base64变量
  • 支持的音频格式:MP3、WAV、M4A、FLAC、AAC

应用场景

  • 语音提示和播报系统
  • 会议录音转文字记录
  • 语音指令识别处理
  • 多媒体内容自动化处理

注意事项

  • 确保语音转换服务正常运行
  • 音频质量直接影响语音识别准确率
  • 长文本转语音时注意服务的时间限制
  • 建议对重要语音识别结果进行人工校对