简要概述
3万+积压案件处理、95%+OCR识别率、标准化归档交付。
项目背景
该仲裁委员会历史积压案件约3万件,主要为纸质卷宗扫描件与部分电子文档。由于历史原因,卷宗目录结构混乱、扫描件命名不规范、案件关键要素(如当事人、标的额、审结日期)缺失严重,无法满足档案局数字化归档要求,也无法支撑后续的案件查询与统计分析。
30,000+
历史积压案件数量
非结构化
原始数据主要为PDF/JPG
合规要求
需符合省档案局归档标准
解决方案
实施路径
1OCR识别:采用高精度OCR引擎识别案卷全文,建立双层PDF。
2目录重构:基于正则与NLP识别文书类型,自动生成标准卷宗目录。
3要素提取:提取案号、当事人、案由、结案方式等30+关键字段。
4人工复核:专业法务团队对低置信度数据进行人工校验。