关于博通

“档案大脑”破局档案管理

发布者:福建博通软件有限公司    时间:2025.06.27

    公司自2019年以来,始终坚定锚定档案行业智能化技术开发领域,凭借持续投入的决心与创新开拓的精神,在这片专业天地中深耕细作。
    经过6年多的努力,公司在档案行业智能化技术领域的探索已形成体系化创新,构建了涉及“收、管、存、用”各业务场景的“档案大脑”,全面赋能档案管理全流程数字化转型。其中智能开放审核、智能编研、智能质检、智能筛密、智能问答已广泛应用在各级综合档案馆和档案室。

一、智能开放审核:大模型驱动的智能合规校验体系
        技术架构:基于Deepseek/Qwen主流大模型构建 “语义分析 + 规则引擎 + 反馈优化”三位一体审核框架,通过自然语言处理技术实现三重核心能力:
1.自动化初审:对档案文本进行语义解析,实时执行敏感信息识别、涉密关键词筛查,单份档案审核效率提升80%以上。
2.结构化决策:内置动态规则库(整合《档案法》《保密法》等+法规文件),自动生成开放等级判定(如“开放”“控制”等)。
3.可解释性机制:对机审结果提供可视化溯源,在原文中高亮标注敏感词位置、规则匹配逻辑,支持人工复审时一键定位争议内容,审核误差率降低至 3% 以下。
二、智能编研:大语言模型重塑档案知识生产
        技术创新:依托Deepseek/Qwen大模型构建“模板生成+知识推理+交互补充”编研闭环:
1.全宗指南自动化生成:输入全宗分类、沿革数据等基础信息,模型自动按 “机构概况 - 档案内容 - 价值评估”模板生成结构化指南,段落衔接流畅度达人工写作水平,大大提供工作效率。
2.智能问答辅助编研:内置档案领域知识图谱,支持通过自然语言提问,模型实时检索关联数据并输出Markdown格式回复,可直接复制用于编研成果补充。
3.多轮交互优化:支持编研人员对生成内容进行“增删改”指令修正,模型通过强化学习自动优化后续生成策略,减少人工修订量。

三、智能质检:多层级技术构建数字化成果质控网
        基于OpenCV/DIPlib用于基础图像处理,深度学习框架TensorFlow/PyTorch用于复杂的缺陷识别以及ocr引擎集成等技术,多维度进行对数字化成果质量进行检测,包含目录检测、原文检测(空白页检测、图像边缘检测、可读性检测、模糊页检测、色差检测、清晰度检测等)、关联性检测,显著提高数字化成果质检效率,降低人工复核成本。
四、智能筛密:多模态AI守护档案安全防线
        技术融合:构建“文本识别+图像特征敏感元素识别”多模态机制:
1.文本识别:利用OCR文字识别模型,对识别文字进行深度分析,并依据相对位置,文字尺寸比例,上下文信息多算法综合分析涉密关键词字词与密级标识的匹配程度。通过对难识别的手写体进行大量标注,可支持对OCR识别模型再次微调提高以文字标识识别的精准度。
2.图像特征筛密:利用图像目标检测模型,对筛密图像进行深度分析,并依据相对位置,图像纹理,颜色,尺寸,上下文信息多算法综合分析图像区域内的各种符号标记与密级标识的匹配程度。通过对图像标记进行大量标注,可支持对图形目标检测模型不断迭代训练提高涉密特殊符号标记的识别精准度。
系统实现对涉密文件的检查和涉密文件的处理,支持对图片、文本、PDF、OFD等各种格式进行涉密文件AI智能检查和筛密,达到国家对涉密文件筛密的相关标准要求。

五、智能问答:向量检索重构档案服务体验
        技术突破:采用“分块检索+语义增强”架构优化传统检索模式:
1.数据预处理:通过Deepseek/Qwen模型动态切分长文本,按语义单元生成向量索引,检索召回率提升30%。
2.多模态输入:支持上传PDF、图片等非结构化文档,通过 OCR 技术提取文本后,自动转换为Markdown格式结构化数据,实现“上传文件直接问”的交互体验。
3.答案精准度:内置档案领域检索增强生成(RAG)系统,对用户提问可定位至具体档案页码并高亮原文,答案准确率达92%以上。
        目前,我司构建的“档案大脑”已形成10多项具有自主知识产品的人工智能产品,并多次获得国家档案局的《国家档案科技成果奖》。技术方案已在福建省、辽宁省、天津市、内蒙古自治区、浙江省、江西省、四川省等10余省份综合档案馆和档案室落地。未来,公司将依托公司强大的人工智能研发团队,持续探索大模型在档案知识图谱构建、多模态、智能体等场景的深度应用。
返回列表

BOTONG SOFTWARE | 博通福州总部

Add.:福州市软件大道89号福州软件园F区2号楼9层

Fax.:0591-87382194

0591 - 8786 - 2733

0591 - 8786 - 1733

福建博通软件有限公司©2007-2018 All rights reserved. 闽ICP备2022003167号