Appearance
OCR文字识别
组件概述
OCR文字识别组件通过调用OCR服务接口,将图片中的文字内容转换为可编辑和处理的文本数据,实现自动化文字提取功能。
配置说明
OCR服务URL
- 作用:指定OCR识别服务的API接口地址
- 格式:完整的HTTPS端点地址,例如:
https://your-ocr-api-endpoint.com
图片选择
提供多种方式指定需要识别的图片源:
选择图片
- 功能:手动上传本地图片文件进行识别
- 支持格式:JPG、JPEG、PNG、BMP、GIF、TIFF
图片base64变量名
- 功能:通过变量传递base64编码的图片数据
- 格式要求:完整的base64字符串(包含
data:image/...前缀)
图片路径变量名
- 功能:通过变量传递图片文件系统路径
- 格式要求:有效的本地文件路径(/path/to/image.jpg)
使用优先级
系统按以下顺序选择图片源:
- base64变量(最高优先级)
- 手动上传
- 路径变量(最低优先级)
数据输出
分配给变量
将识别出的文字内容保存到变量中
- 变量名称:指定存储识别结果的变量名称
插入表格
将识别结果插入到表中
- 选择列:指定插入识别结果的表格列
应用场景
- 发票信息自动录入
- 证件文字提取
- 文档数字化处理
- 图片验证码识别
注意事项
- 确保OCR服务可用且网络连接正常
- 图片质量直接影响识别准确率
- 建议对识别结果进行校验和后处理

MakAgent在线文档