Scriber

文档信息智能认知系统

让机器读懂业务文档,提供你所需要的关键信息

支持识别的文档类型

任意版面格式的制式文档,文档主要信息以键值对(key-value pair)的形式展示(例如 “时间: 10/28/2020”)

各类型证件

各领域发票

各行业单据

可视化训练提取模型

交互界面进行模型的构建、数据标注、模型训练(目前接入模型为微软通用文档预训练模型 LayoutLM)、并发布生产

构建模型

根据文档,配置需要提取的信息(定义key)

Step 1

标注文档

上传一定量的文档,从文档中标注key对应的value

Step 2

构建数据集

打包标注过的文档,构建数据集用于模型训练,也可构建测试集

Step 3

模型训练

系统上训练模型,可扩充数据集训练多个版本、并测试评估

Step 4

发布生产

达到满意效果,可启用模型发布生产,上传文档可自动抽取

Step 5

功能亮点

完全可视化的界面操作,成熟的数据标注和训练体系,简单易用

通过神经网络模型增强key-value识别的准确率,可适应key-value位置变化、key文本描述变动以及复杂的版面格式

支持多版本(不同样本量)模型训练和评估,以实现最优抽取效果

版本比较

概述

自定义模型并进行训练、实现制式文档的key-value信息提取
客户可自定义信息框架内容,智能化、自动化地从批量的业务文档中提取关键信息并呈现给客户
快捷建立信息项要素,自由框选轻松提取关键信息,快速导出提取内容

用户权限

可创建多用户
可分配不同用户在系统内的操作权限
下载安装,微信登录

使用方式

web应用
客户定制化部署:支持API接口上传文档及获取结果,可对接企业上下游系统
客户端,支持 macOS、Windows 平台

使用范围

多用户
多人协作,高效复核
单用户

信息提取方式

自定义“制式文档”key-value信息提取框架,支持手动提取、并训练AI模型实现自动提取
客户自定义信息框架,支持各类信息框架的AI模型训练
支持不同场景的文档批量提取
自由快捷建立信息项要素
导入已保存的信息项,即导即用,快速提取

更多特点

不同样本量下进行模型训练和评估,以实现最优抽取效果
神经网络模型适应key-value位置变化、key文本描述变动以及复杂的版面格式
AI提示,智能快捷
为客户提供全面的服务支持
快速导出提取内容
为用户提供良好的产品功能体验

我们服务的客户

现在开始,借助人工智能

更有效、更高效地让海量文档“读薄”,一起推动金融场景的效率提升和体验改善

部署安装