纸质档案数字化规范(DAT31-2017)

 2024-08-19     产品中心
产品详情

  下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

  表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。

  采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字图像,并按照纸质档案的内在联系,建立起目录数据与数字图像关联关系的处理过程。

  4.1各单位应根据档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素,统筹规划、科学开展纸质档案数字化工作。纸质档案数字化工作的开展应遵循ISO/TR13028和GB/T20530—2006提出的要求和建议。

  4.2纸质档案数字化的基本环节最重要的包含:数字化前处理、目录数据库建立、档案扫描、图像处理、数据挂接、数字化成果验收与移交等。

  4.3应采取比较有效的管理和技术方法,确保纸质档案数字化成果质量。纸质档案数字化应遵循档案管理的客观规律,真实反映档案内容,最大限度地展现档案原貌。

  4.4纸质档案数字化过程中,应保存数字化项目信息、技术环境、各类数字化技术参数等方面的元数据。元数据元素的确定应符合ISO/TR13028提出的要求。

  4.5应加强纸质档案数字化各环节的安全管理,确保档案实体和档案信息的安全。

  4.6加工涉密档案时,应按照涉密档案相关保密要求开展工作。

  5.1.1应建立纸质档案数字化工作组织,对数字化工作进行统筹规划、组织实施、协调管理、安全保障、技术保障、监督检查、成果验收等,确保数字化工作的顺利开展。

  5.1.2应配备具有相应能力的工作人员,包括熟悉档案业务并具有较高的调查研究水平和良好的组织领导能力的管理人员,熟悉有关标准规范并能够为纸质档案数字化工作各环节提供技术上的支持的技术人员,掌握一定数字化基础知识并熟悉本职工作的操作人员等。应通过科学规范的管理制度,对工作人员进行规范化管理。为强化数字化工作的安全性,应加强对外聘工作人员的审核。

  5.2.1应配备专用加工场地,并做到合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。

  5.2.2加工场地的选择及温湿度等环境的控制不应不利于档案实体的保护。场地内应配备可覆盖全部场地的防火、防水、防有害生物、防盗报警、视频监控等安全管理的设施设备。

  5.2.3应合理规划、配备和管理纸质档案数字化设施设备,确保设施设备安全、先进,能够很好的满足数字化工作的需要。

  5.3.1应在充分调研的基础上,制定科学合理的工作方案,确保纸质档案数字化工作达到预期目标。

  5.3.2纸质档案数字化工作方案应包括数字化对象、工作目标、工作内容、成本核算、数字化技术方法和主要技术指标、验收依据、人员安排、责任分工、进度安排、安全管理措施等内容。数字化对象的确定应考虑档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素。

  5.3.3宜对纸质档案数字化工作方案进行专家论证,确保其科学、规范、合理。

  5.3.4纸质档案数字化工作方案应经审批后严格执行。工作方案审批结果应与数字化工作过程中形成的别的文件一并保存。

  5.4.1应制定科学化、规范化的管理制度,并在工作过程中严格执行,以有效保障档案安全和纸质档案数字化成果质量。

  5.4.2纸质档案数字化管理制度应包含岗位管理、人员管理、场地管理、设备管理、数据管理、档案实体管理等方面的制度。岗位管理制度主要规定数字化工作各岗位的工作目标和职责,形成明确的岗位业务流程规范、考核标准、奖惩办法等;人员管理制度主要对人员的安全责任、日常行为、外聘人员信息审核及管理、非工作人员来访登记等进行规范;场地管理制度主要对人员出入和工作场地内基础设施、环境、网络、监控设施、现场物品、证件等的管理进行规范;设备管理制度主要对数字化工作各环节涉及的全部设备的管理进行规范;数据管理制度主要对数字化各环节所产生的数据的管理进行规范;档案实体管理制度主要对档案实体在数字化过程中的交接、管理、存放等工作进行规范。

  5.5.1应依据相关的法律和法规和各类技术标准,制定相关的工作流程和各环节操作规范等,对纸质档案数字化全过程进行相对有效的控制,确保数字化成果质量。纸质档案数字化流程示例参见附录A。

  5.5.2应加强对纸质档案数字化工作的全流程安全管理。

  5.5.3应建立完善的问题反馈机制,对纸质档案数字化工作过程中后端环节发现前端环节中产生的问题进行及时反馈和修正。

  5.6.1应依据情况制定符合实际要求的纸质档案数字化工作文件,以此加强对数字化工作的管理。最重要的包含纸质档案数字化工作方案、纸质档案数字化审批书、纸质档案数字化流程单、数据验收单、项目验收报告、纸质档案数字化成果移交清单等,采取外包方式实施时,还应包括项目招标文件、投标文件、中标通知书、项目合同、保密协议等。部分工作文件示例参见附录B。

  5.6.2应加强对纸质档案数字化工作文件的管理,明确数字化工作过程中形成的工作文件的整理、归档、移交等管理要求。

  5.7.1纸质档案数字化工作如需外包,档案部门应从企业性质、股东组成、安全保密、企业规模、注册投资的金额情况等方面严格审查数字化加工企业的相关资质;按照OB/T20530—2006中第5章的要求评估数字化加工企业的技术能力;从规章制度的建立完整程度等方面考查加工公司的管理能力。如需审查数字化加工企业的保密资质,档案部门应按照《国家秘密载体印制资质管理办法》(国保发〔2012〕7号)等文件的要求执行。

  5.7.2在项目实施过程中,应依据《档案数字化外包安全管理规范》(档办发〔2014〕7号),从档案部门、数字化服务机构、数字化场所、数字化加工设施、档案实体、数字化成果移交接收与设备处理等层面执行严格的安全管理要求。

  5.7.3档案部门应指派专门人员参与纸质档案数字化外包业务的监督、指导,完成质量监控、进度监控、投资监控、安全监控和协调沟通等方面的工作。

  6.1档案保管部门应按照纸质档案数字化工作方案确定的数字化对象开展档案调取、清点、登记等前期准备工作,并提交档案出库申请,经相关责任人批准后,严格按照档案库房管理规定为数字化对象办理出库相关手续,并与数字化部门共同清点无误后,对档案进行交接出库。

  6.2纸质档案数字化过程中,应设置距离数字化加工场所较近的保管库用以临时存放纸质档案,并对纸质档案的领取与归还进行严格管理,认真做好检查、清点、登记等工作,确保纸质档案的安全。

  原则上应将确定为数字化对象的纸质档案全部扫描,不宜进行挑扫。如有不需要扫描的页面应加以标注。

  7.2.1应对没有页号或页号不正确的档案重新编制页号。

  7.2.2重新编制页号时,应在统一位置书写页号,且不压盖档案内容。

  7.2.3书写页号所使用的笔、墨等不应破坏档案原件或对档案长期保存造成影响。

  7.2.4应将破损页面、缺页等特殊情况做登记。

  7.3.1按照目录数据库建立时制定的数据规则,对照档案原件内容,规范档案中的目录内容。

  7.3.2对需在目录数据库中进行标记的情况做标记。

  应以对纸质档案的保护为原则确定是不是拆除装订。如需拆除装订物,应注意保护档案不受损害,并对排列顺序不准确的档案进行重排。特殊装订且拆除装订后需恢复的档案,在拆除装订物时应采用拍照等方式记录档案原貌,以便于恢复。

  7.5.1破损严重或其他无法直接进行扫描的纸质档案,应先由专业方面技术人员进行技术修复。

  7.5.2折皱不平影响扫描质量的纸质档案应先进行压平等相应技术处理。

  8.1应制定目录数据库数据规则,包括数据字段长度、字段类型、字段内容要求等。目录数据库数据规则的制定应符合DA/T18对档案著录的要求。在纸质档案目录准备与目录数据库建立工作中均应严格遵守。

  8.2数据库选择应考虑可转换为通用数据格式,以便于数据交换。

  8.3数据库结构的设计应格外的注意保持档案的内在联系,有利于纸质档案数字化成果的管理和利用。

  8.4将纸质档案数字化前处理工作中对纸质档案目录做修改、补充的结果录入数据库,形成准确、完整的目录数据。

  8.5可采用计算机自动校对与人工校对相结合的方式,对目录数据的质量进行全方位检查,包括著录项目的完整性、著录内容的规范性和准确性等。发现不合格的数据应及时进行修改。

  档案扫描应根据纸质档案原件真实的情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备,进行有关参数的设置和调整。参数的设置和调整应保证扫描后数字图像清晰、完整、不失真,图像效果最接近档案原貌。

  9.2.1扫描设备的选择应格外的注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备做数字化。

  9.2.2超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也能够使用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标板等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的1/3。

  9.2.3对于极其珍贵且尺寸不规则的档案,为方便直观显示原件大小,可采用标板、标尺等方式标识原件大小等信息。

  9.2.4应遵循相关设备的使用规律进行定期维护、保养。

  9.3.1为最大限度保留档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描。

  9.3.2页面中有红头、印章或插有照片、彩色插图、多色彩文字等的档案,应采用彩色模式进行扫描。

  9.3.3页面为黑白两色,并且字迹清晰、不带插图的档案,也可采用黑白二值模式进行扫描。

  9.3.4页面为黑白两色,但字迹清晰度差或带有插图的档案,也可采用灰度模式扫描。

  9.4.1扫描分辨率的选择,应保证扫描后图像清晰、完整,并考虑数字图像后期利用方式等因素。

  9.4.3如有计算机输出缩微摄影(COM)、仿真复制、印刷出版等其他用途时,可根据自身的需求调整扫描分辨率。有必要进行COM输出的档案,扫描分辨率建议不小于300dpi;有必要进行高精度仿真复制的档案,扫描分辨率建议不小于600dpi;有必要进行印刷出版的档案,可结合档案幅面、印刷出版幅面、印刷精度要求等选择正真适合的分辨率。

  9.5.1纸质档案数字图像长期保存格式为TIFF、JPEG或JPEG2000等通用格式,图像压缩率的选择可结合实际应用的需求而定。

  9.5.2纸质档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面做综合考虑,将图像转换为OFD、PDF等其他格式。

  9.6.1应以档号为基础对数字图像命名。图像命名方式的选择应确保图像命名的唯一性。

  9.6.2建议将数字图像存储为单页文件,并按档号与图像流水号的组合对图像命名。

  9.6.3数字图像确需存储为多页文件时,可采用该档案的档号对图像命名。

  9.6.4应科学建立纸质档案数字图像的存储路径,确保数据挂接的准确性。

  对分幅扫描形成的多幅数字图像,应进行拼接处理,合并为一个完整的图像,以保证纸质档案数字图像的整体性。拼接时应确保拼接处平滑地融合,拼接后整幅图像无明显拼接痕迹。

  对不符合阅读方向的数字图像应进行旋转还原。对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。

  如需对数字图像进行裁边处理,应在距页边最外延至少2mm~3mm处裁剪图像。

  如需对数字图像进行去污处理,以去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质,应遵循展现档案原貌的原则,处理过程中不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等痕迹。

  10.5.1数字图像不完整、无法清晰识别或图像失真度较大时,应重新扫描。

  10.5.2对于漏扫、重扫、多扫等情况,应及时改正。

  10.5.3数字图像的排列顺序与档案原件不一致时,应及时进行调整。

  10.5.4对数字图像拼接、旋转及纠偏、裁边、去污等处理情况做检查,发现不符合图像质量要求时,应重新进行图像处理。

  11.1应借助相关软件对数据库中的目录数据和与其对应的纸质档案数字图像进行挂接,以实现目录数据与数字图像的关联。

  11.2逐条对挂接结果进行全方位检查,包括目录数据与纸质档案数字图像对应的准确性、已挂接数字图像与实际扫描数量的一致性、数字图像是否能正常打开等,发现错误及时进行纠正。

  12.1.1建议档案部门成立专门的验收组对纸质档案数字化成果进行验收。

  12.1.2应采用计算机自动检验与人工检验相结合的方式对纸质档案数字化成果进行验收检验。

  12.2.1纸质档案数字化成果包括数字图像、档案目录数据、元数据、数字化工作中产生的工作文件、存储载体等。

  12.2.2应对目录数据来进行验收,最重要的包含数据库中各条目的内容、格式等的准确程度以及必填项是否填写等。

  12.2.3应对元数据进行验收,最重要的包含元数据元素的完整性和赋值规范性等。

  12.2.4应对数字图像进行验收,最重要的包含数字化参数、存储路径、命名的准确性、图像的完整性、排列顺序的准确性、图像质量等。

  12.2.5应对数据挂接进行验收,最重要的包含目录数据和与其对应的数字图像的挂接的准确性等。

  12.2.6应对工作文件进行验收,最重要的包含工作文件的完整性、规范性等。

  12.2.7应对存储载体进行验收,最重要的包含载体的可用性、有无病毒等。

  能够采用计算机自动检验的项目应采用计算机自动检验的方式来进行100%检验,检验合格率应为100%。对于无法用计算机自动检验的项目,可依据情况以件或卷为单位采用抽检的方式来进行人工检验。抽检比率不能低于5%,对于数据库条目与数字图像内容对应的准确性,抽检合格率应为100%,其他内容的抽检合格率应不低于95%。

  12.4.1每批纸质档案数字化成果质量检验达到12.2和12.3的要求,予以验收“通过”。验收未通过应视情况做返工或修改后,重新进行验收。

  12.4.2验收完成后应经验收组成员签字。验收“通过”的结论,应经相关领导审核、签字后方有效。

  验收合格的数据应按照纸质档案数字化工作方案及时移交,并履行交接手续。移交单示例参见附录B的表B.8。

  纸质档案数字化工作完成后,拆除过装订物的档案如需装订,应注意保持档案原貌,做到安全、准确、无遗漏。