一、背景介绍
档案数字化加工是信息社会建设的需要,也是档案现代化建设的重要内容,但在建设过程中却经常有一些问题,如由于管理不善或技术上的原因,造成档案资料泄漏,丢失、污染、损坏、破坏,以及原始档案资料被删除、篡改等。上述问题的出现,严重威胁到原始档案和档案信息的安全,而档案数字化加工能够使得档案更好的得到保护。
二、定义解读
档案的数字化加工通常指对档案的扫描服务,即纸质档案的扫描整合了档案扫描、OCR识别和文件管理等技术,能够快速、自动地将成千上万份纸介质文件、档案、书刊等转化为电子文本、图像,实现信息的高速检索。
三、流程介绍
具体工作流程主要包括:文件提取,文件贴码整理,目录输入,文件扫描,图像处理,图片质量检验,文件总质量检验,图片上传,数据备份,导入档案管理系统归档,实体文件归架。
四、重要环节
1.扫描
将成批纸张介质的文件、档案、书籍等用扫描仪扫描一遍。
2.图像处理
进行图象去歪曲,黑点,黑边等操作。
3.提取有效信息
从图片中提取有用的信息(利用OCR技术),有用的信息我们通常称为关键字或索引值(如保险单中受益人的名字和身份证号都是关键字),这样便于查询。
4.管理和利用
一般扫描服务的最后一步就是对扫描后的电子文件进行管理,比如“文档管理系统”,“知识管理系统”,都属于这种类型的管理软件。利用这些电子文档管理这些文件,查询使用十分方便。
五、遵循原则
1.价值性原则
将档案内容有无重要或较重要的查考利用价值作为档案数字化处理的首要依据。这类档案,在见证历史、传承文化方面,具有普遍和长期的使用价值,在服务国家政治大局等方面,具有珍贵的史料价值。
2.实用性原则
参考文件的使用要求和使用频率作为档案利用的依据。能满足大众历史文化需求,对明清史文化研究有重要参考价值,档案原稿使用频率较高。
3.系统性原则
为保证数字化图像处理档案内容的连续性和完整性提供参考。重点考虑数字化图像处理档案的全宗完整,来源上、时间上、形式上的连续性和完整性。
4.现实性原则
基于当前数字化图像加工条件和档案现状,充分考虑档案数字化图像加工所需的人力资源、数字化加工设备能力和档案实际状况(包括馆藏文件的数字化基础、整理基础、档案形态、数量和残损程度)。
上一篇:涉密档案数字化加工
下一篇:档案知识问答 100题