Skip to content

OCR文字识别

组件概述

OCR文字识别组件通过调用OCR服务接口,将图片中的文字内容转换为可编辑和处理的文本数据,实现自动化文字提取功能。

配置说明

OCR服务URL

  • 作用:指定OCR识别服务的API接口地址
  • 格式:完整的HTTPS端点地址,例如:https://your-ocr-api-endpoint.com

图片选择

提供多种方式指定需要识别的图片源:

选择图片

  • 功能:手动上传本地图片文件进行识别
  • 支持格式:JPG、JPEG、PNG、BMP、GIF、TIFF

图片base64变量名

  • 功能:通过变量传递base64编码的图片数据
  • 格式要求:完整的base64字符串(包含data:image/...前缀)

图片路径变量名

  • 功能:通过变量传递图片文件系统路径
  • 格式要求:有效的本地文件路径(/path/to/image.jpg)

使用优先级

系统按以下顺序选择图片源:

  1. base64变量(最高优先级)
  2. 手动上传
  3. 路径变量(最低优先级)

数据输出

分配给变量

将识别出的文字内容保存到变量

  • 变量名称:指定存储识别结果的变量名称

插入表格

将识别结果插入到

  • 选择列:指定插入识别结果的表格列

应用场景

  • 发票信息自动录入
  • 证件文字提取
  • 文档数字化处理
  • 图片验证码识别

注意事项

  • 确保OCR服务可用且网络连接正常
  • 图片质量直接影响识别准确率
  • 建议对识别结果进行校验和后处理

OCR文字识别