Scriber

文档信息智能认知系统

让机器读懂业务文档,提供你所需要的关键信息

illustrate
screenshot

灵活设计不同信息要素清单

根据业务需要和文档类型,自主定义待抽取要素字段,支持文本、数字、日期格式校验,以及多层级字段组合

screenshot

鼠标画框,轻松提取文档内容

只需利用鼠标在原文档中画框,即可自动提取文本、段落、表格内容,不同位置内容可合并提取

screenshot

清晰的文档内容和信息阅读界面

文档内容和抽取结果清单对比阅读,点击抽取结果,跳转原文档定位,记录信息出处、用于跟踪确认结果

screenshot

多人抽取同一文档,复核信息

同一份文档可由不同人员进行抽取,多人提交的结果进行比较、第三人复核、确保结果正确性

screenshot

AI模型智能预测要素信息

标注过程中,可训练AI模型,AI模型自动预测要素位置并推荐结果,实现文档信息的自动提取

个人版客户端

支持 Windows 与 macOS 系统

当前更新版本: V 1.0.19

当前更新日期:2019-11-06

monitor
screenshot

快捷建立信息项要素

自主添加定义待抽取信息项字段,支持随时修改信息

screenshot

自由框选,轻松提取文档

支持多种画框,自动合并提取文档中段落,表格等关键内容

screenshot

一键查阅文档内容

点击信息项内容可对应跟踪查阅原文内容,方便校验

screenshot

快速导出信息统计结果表格

完成提取后可导出信息汇总 Excel 文件,获取终版结果

支持识别的文档类型

任意版面格式的制式文档,文档主要信息以键值对(key-value pair)的形式展示(例如 “时间: 10/28/2020”)

doc-type-1

各类型证件

doc-type-2

各领域发票

doc-type-3

各行业单据

可视化训练提取模型

交互界面进行模型的构建、数据标注、模型训练(目前接入模型为微软通用文档预训练模型 LayoutLM)、并发布生产

step-1
构建模型

根据文档,配置需要提取的信息(定义key)

Step 1

step-2
标注文档

上传一定量的文档,从文档中标注key对应的value

Step 2

step-3
构建数据集

打包标注过的文档,构建数据集用于模型训练,也可构建测试集

Step 3

step-4
模型训练

系统上训练模型,可扩充数据集训练多个版本、并测试评估

Step 4

step-5
发布生产

达到满意效果,可启用模型发布生产,上传文档可自动抽取

Step 5

功能亮点

features

完全可视化的界面操作,成熟的数据标注和训练体系,简单易用

features

通过神经网络模型增强key-value识别的准确率,可适应key-value位置变化、key文本描述变动以及复杂的版面格式

features

支持多版本(不同样本量)模型训练和评估,以实现最优抽取效果

版本比较

概述

自定义模型并进行训练、实现制式文档的key-value信息提取
客户可自定义信息框架内容,智能化、自动化地从批量的业务文档中提取关键信息并呈现给客户
快捷建立信息项要素,自由框选轻松提取关键信息,快速导出提取内容

用户权限

可创建多用户
可分配不同用户在系统内的操作权限
下载安装,微信登录

使用方式

web应用
客户定制化部署:支持API接口上传文档及获取结果,可对接企业上下游系统
客户端,支持 macOS、Windows 平台

使用范围

多用户
多人协作
单用户

信息提取方式

自定义“制式文档”key-value信息提取框架,支持手动提取、并训练AI模型实现自动提取
客户自定义信息框架,支持各类信息框架的AI模型训练
支持不同场景的文档批量提取
自由快捷建立信息项要素
导入已保存的信息项,即导即用,快速提取

更多特点

不同样本量下进行模型训练和评估,抽取效果好
神经网络模型适应key-value位置变化、key文本描述变动以及复杂的版面格式
AI提示,智能快捷
为客户提供全方位的服务支持
快速导出提取内容
为用户提供良好的产品功能体验

我们服务的客户

上交所
深交所
港交所
中金所
北金所
证通股份
中信证券
中信建投
中金
华泰联合证券
海通证券
国泰君安
银河证券
招商证券
光大证券
国信证券
中泰证券
兴业证券
长江证券
东兴证券
财通证券
广发证券
开源证券
东北证券
民生证券
平安证券
中银国际证券
西南证券
中德证券
华安证券
中国银行
中国农业银行
中信银行
宁波银行
杭州银行
青岛银行
华夏基金
工银瑞信
易方达
交银施罗德
中诚信国际
pwc

文档信息智能认知系统,自动化生产结构化数据

部署安装