Scriber

文档信息智能认知系统

让机器读懂业务文档,提供你所需要的关键信息

illustrate
screenshot

灵活设计不同信息要素清单

根据业务需要和文档类型,自主定义待抽取要素字段,支持文本、数字、日期格式校验,以及多层级字段组合

screenshot

鼠标画框,轻松提取文档内容

只需利用鼠标在原文档中画框,即可自动提取文本、段落、表格内容,不同位置内容可合并提取

screenshot

清晰的文档内容和信息阅读界面

文档内容和抽取结果清单对比阅读,点击抽取结果,跳转原文档定位,记录信息出处、用于跟踪确认结果

screenshot

多人抽取同一文档,复核信息

同一份文档可由不同人员进行抽取,多人提交的结果进行比较、第三人复核、确保结果正确性

screenshot

AI模型智能预测要素信息

标注过程中,可训练AI模型,AI模型自动预测要素位置并推荐结果,实现文档信息的自动提取

支持识别的文档类型

任意版面格式的制式文档,文档主要信息以键值对(key-value pair)的形式展示(例如 “时间: 10/28/2020”)

doc-type-1

各类型证件

doc-type-2

各领域发票

doc-type-3

各行业单据

可视化训练提取模型

交互界面进行模型的构建、数据标注、模型训练(目前接入模型为微软通用文档预训练模型 LayoutLM)、并发布生产

step-1
构建模型

根据文档,配置需要提取的信息(定义key)

Step 1

step-2
标注文档

上传一定量的文档,从文档中标注key对应的value

Step 2

step-3
构建数据集

打包标注过的文档,构建数据集用于模型训练,也可构建测试集

Step 3

step-4
模型训练

系统上训练模型,可扩充数据集训练多个版本、并测试评估

Step 4

step-5
发布生产

达到满意效果,可启用模型发布生产,上传文档可自动抽取

Step 5

功能亮点

features

完全可视化的界面操作,成熟的数据标注和训练体系,简单易用

features

通过神经网络模型增强key-value识别的准确率,可适应key-value位置变化、key文本描述变动以及复杂的版面格式

features

支持多版本(不同样本量)模型训练和评估,以实现最优抽取效果

我们服务的客户

上交所
深交所
港交所
中金所
北金所
证通股份
中信证券
中信建投
中金
华泰联合证券
海通证券
国泰君安
银河证券
招商证券
光大证券
国信证券
中泰证券
兴业证券
长江证券
东兴证券
财通证券
广发证券
开源证券
东北证券
民生证券
平安证券
中银国际证券
西南证券
中德证券
华安证券
中国银行
中国农业银行
中信银行
宁波银行
杭州银行
青岛银行
华夏基金
工银瑞信
易方达
交银施罗德
中诚信国际
pwc

文档信息智能认知系统,自动化生产结构化数据