Scriber
文档信息智能认知系统
让机器读懂业务文档,提供你所需要的关键信息
让机器读懂业务文档,提供你所需要的关键信息
根据业务需要和文档类型,自主定义待抽取要素字段,支持文本、数字、日期格式校验,以及多层级字段组合
只需利用鼠标在原文档中画框,即可自动提取文本、段落、表格内容,不同位置内容可合并提取
文档内容和抽取结果清单对比阅读,点击抽取结果,跳转原文档定位,记录信息出处、用于跟踪确认结果
同一份文档可由不同人员进行抽取,多人提交的结果进行比较、第三人复核、确保结果正确性
标注过程中,可训练AI模型,AI模型自动预测要素位置并推荐结果,实现文档信息的自动提取
当前更新版本: V 1.0.19
当前更新日期:2019-11-06
自主添加定义待抽取信息项字段,支持随时修改信息
支持多种画框,自动合并提取文档中段落,表格等关键内容
点击信息项内容可对应跟踪查阅原文内容,方便校验
完成提取后可导出信息汇总 Excel 文件,获取终版结果
任意版面格式的制式文档,文档主要信息以键值对(key-value pair)的形式展示(例如 “时间: 10/28/2020”)
各类型证件
各领域发票
各行业单据
交互界面进行模型的构建、数据标注、模型训练(目前接入模型为微软通用文档预训练模型 LayoutLM)、并发布生产
根据文档,配置需要提取的信息(定义key)
Step 1
上传一定量的文档,从文档中标注key对应的value
Step 2
打包标注过的文档,构建数据集用于模型训练,也可构建测试集
Step 3
系统上训练模型,可扩充数据集训练多个版本、并测试评估
Step 4
达到满意效果,可启用模型发布生产,上传文档可自动抽取
Step 5
完全可视化的界面操作,成熟的数据标注和训练体系,简单易用
通过神经网络模型增强key-value识别的准确率,可适应key-value位置变化、key文本描述变动以及复杂的版面格式
支持多版本(不同样本量)模型训练和评估,以实现最优抽取效果
概述
用户权限
使用方式
使用范围
信息提取方式
更多特点
文档信息智能认知系统,自动化生产结构化数据
部署安装