Scriber

文档信息智能认知系统

让机器读懂业务文档,提供你所需要的关键信息

illustrate
screenshot

灵活设计不同信息要素清单

根据业务需要和文档类型,自主定义待抽取要素字段,支持文本、数字、日期格式校验,以及多层级字段组合

screenshot

鼠标画框,轻松提取文档内容

只需利用鼠标在原文档中画框,即可自动提取文本、段落、表格内容,不同位置内容可合并提取

screenshot

清晰的文档内容和信息阅读界面

文档内容和抽取结果清单对比阅读,点击抽取结果,跳转原文档定位,记录信息出处、用于跟踪确认结果

screenshot

多人抽取同一文档,复核信息

同一份文档可由不同人员进行抽取,多人提交的结果进行比较、第三人复核、确保结果正确性

screenshot

AI模型智能预测要素信息

标注过程中,可训练AI模型,AI模型自动预测要素位置并推荐结果,实现文档信息的自动提取

个人版客户端

支持 Windows 与 macOS 系统

当前更新版本: V 1.0.19

当前更新日期:2019-11-06

monitor
screenshot

快捷建立信息项要素

自主添加定义待抽取信息项字段,支持随时修改信息

screenshot

自由框选,轻松提取文档

支持多种画框,自动合并提取文档中段落,表格等关键内容

screenshot

一键查阅文档内容

点击信息项内容可对应跟踪查阅原文内容,方便校验

screenshot

快速导出信息统计结果表格

完成提取后可导出信息汇总Excel文件,获取最终结果

支持识别的文档类型

任意版面格式的制式文档,文档主要信息以键值对(key-value pair)的形式展示(例如 “时间: 10/28/2020”)

各类型证件

各领域发票

各行业单据

可视化训练提取模型

交互界面进行模型的构建、数据标注、模型训练(目前接入模型为微软通用文档预训练模型 LayoutLM)、并发布生产

构建模型

根据文档,配置需要提取的信息(定义key)

Step 1

标注文档

上传一定量的文档,从文档中标注key对应的value

Step 2

构建数据集

打包标注过的文档,构建数据集用于模型训练,也可构建测试集

Step 3

模型训练

系统上训练模型,可扩充数据集训练多个版本、并测试评估

Step 4

发布生产

达到满意效果,可启用模型发布生产,上传文档可自动抽取

Step 5

功能亮点

features

完全可视化的界面操作,成熟的数据标注和训练体系,简单易用

features

通过神经网络模型增强key-value识别的准确率,可适应key-value位置变化、key文本描述变动以及复杂的版面格式

features

支持多版本(不同样本量)模型训练和评估,以实现最优抽取效果

版本比较

概述

自定义模型并进行训练、实现制式文档的key-value信息提取
客户可自定义信息框架内容,智能化、自动化地从批量的业务文档中提取关键信息并呈现给客户
快捷建立信息项要素,自由框选轻松提取关键信息,快速导出提取内容

用户权限

可创建多用户
可分配不同用户在系统内的操作权限
下载安装,微信登录

使用方式

web应用
客户定制化部署:支持API接口上传文档及获取结果,可对接企业上下游系统
客户端,支持 macOS、Windows 平台

使用范围

多用户
多人协作,高效复核
单用户

信息提取方式

自定义“制式文档”key-value信息提取框架,支持手动提取、并训练AI模型实现自动提取
客户自定义信息框架,支持各类信息框架的AI模型训练
支持不同场景的文档批量提取
自由快捷建立信息项要素
导入已保存的信息项,即导即用,快速提取

更多特点

不同样本量下进行模型训练和评估,以实现最优抽取效果
神经网络模型适应key-value位置变化、key文本描述变动以及复杂的版面格式
AI提示,智能快捷
为客户提供全面的服务支持
快速导出提取内容
为用户提供良好的产品功能体验

我们服务的客户

现在开始,借助人工智能

更有效、更高效地让海量文档“读薄”,一起推动金融场景的效率提升和体验改善

部署安装