案例展示 / 案例展示

湖北省某地市仲裁委员会数据清洗

3万+积压案件处理、95%+OCR识别率、标准化归档交付。

简要概述

3万+积压案件处理、95%+OCR识别率、标准化归档交付。

项目背景

该仲裁委员会历史积压案件约3万件,主要为纸质卷宗扫描件与部分电子文档。由于历史原因,卷宗目录结构混乱、扫描件命名不规范、案件关键要素(如当事人、标的额、审结日期)缺失严重,无法满足档案局数字化归档要求,也无法支撑后续的案件查询与统计分析。

30,000+

历史积压案件数量

非结构化

原始数据主要为PDF/JPG

合规要求

需符合省档案局归档标准

解决方案

实施路径

1OCR识别:采用高精度OCR引擎识别案卷全文,建立双层PDF。
2目录重构:基于正则与NLP识别文书类型,自动生成标准卷宗目录。
3要素提取:提取案号、当事人、案由、结案方式等30+关键字段。
4人工复核:专业法务团队对低置信度数据进行人工校验。

项目成果

归档率 所有积压案件均通过档案局验收
要素准确率 99.8%关键字段人工复核后达到高精度
查询效率提升 10倍从人工翻阅到毫秒级全文检索