东云睿连-图文识别

核心技术能力

OCR算法

识别扫描图像中的文字，转换为可编辑文本。识别表格等版式信息，加以精确还原。

NLP算法

通过NLP算法实现OCR文本自动校对和人工录入内容的核验。基于大语言模型实现更加智能的人机会话与内容生成。

智能图像处理

对采集的图片进行文件自动识别和文档图像增强，生成文件图片的PDF文档。

关键信息提取

基于交互式区域标定和自动化OCR识别，提取关键信息并导出成excel表格或写入数据库指定字段。

图文内容比对

识别扫描文档和PDF文档对应表格的文字内容。基于OCR识别结果，比对两者之间差异部分文字内容。

表格识别

自动识别图像中的表格版式与内容，精确还原为可编辑格式。

签名笔迹验证

通过智能算法比对签名笔迹的一致性。

身份证识别

支持二代身份证正反面文本信息提取。

车牌识别

对图片中动态或静态下车牌字段信息进行检测，为用户快速提取车牌信息，并协助鉴定车辆身份。

营业执照识别

支持对营业执照的证件编号、社会信用代码、单位、地址、法人、成立日期、有效日期、经营范围等关键字段进行结构化识别。

名片识别

对名片中关键字段信息进行检测与智能结构化识别，为用户快速录入名片关键信息的需求，提供有力支持。

银行卡识别

支持对中国主流银行卡的卡号、银行信息、有效期等关键字段的检测与识别。

增值税发票识别

对发票中关键字段信息进行检测与智能结构化识别，为财务提供有力支持。

多类型票据识别

对机打出租车票中的关键字段提取，助力财务报销审核，减少工作量。