- 50.50 KB
- 2022-05-16 09:41:14 发布
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
光盘档案数据整理、迁移工作流程的优化与实践 :本文仅从北京市朝阳区档案馆按照国家档案局每四年对归档光盘进行一次数据迁移的要求,对馆藏光盘档案重新分类编号、迁移数据并多套备份的工作实践出发,从工作流程的角度分析、探讨如何在档案数据迁移过程中更好地保护档案数据,以及从如何便于最终利用的角度出发存储光盘档案。 关键词:光盘档案整理迁移 一、重新整理光盘档案背景 我馆本次重新整理的光盘档案中,包括馆藏纸质档案数字化数据、馆藏录音和录像带转录的影音文件、馆藏照片扫描图像、其他移交进馆的以光盘为存储介质的档案数据以及北京奥运会筹办及开闭幕期间产生的各类电子文件等。除奥运档案列为单独系列外,其他光盘档案均列在同一序列中。 此种归档方法的优点在于便于光盘档案的统一管理,节约存储空间,适用于光盘档案数量不多,存储空间和条件有限的情况,缺点在于分类不明确,不利于各类内容不同的光盘档案(如文书数字化档案、影音档案、数字化照片档案等)归档存储的连续性和延续性以及各项数据的统计。如光盘档案数量较多且内容差异较大,或可预见在一定时期内光盘档案数量增长较快,应考虑细化分类,以便于统计馆藏各类多媒体电子档案和利用查询。 二、工作流程 我馆参与本次工作的工作人员只有两名,在人员和时间都较为紧张的情况下,经过反复试验,调整细化工作流程为:前期原盘检查——光盘塔复刻3套、标识新编号——光盘目录数据库及封面标签制作——光盘校验——
3套入库存储。同时将各流程中出现的问题及时记录在案,做好工作台账备查。 1.前期原盘检查 前期原盘检查包括可读性、内容的完整性、数据的安全性等多项检查,并填制“数字化档案光盘检测登记表”,记录原光盘实体检查情况。在检查的同时记录光盘存储空间大小、存储格式及具体内容等,为下一步制作光盘目录做好前期准备。 在检查中,对于不可读但可复制(不含涉密数据)的原盘,使用确认运行稳定的刻录软件在稳定的系统环境下重新烧录;对于不可读且不可复制(不含涉密数据)、标识内容与实体内容不符、数据无法使用(影音文件损坏、图像反转、水印反转、数据库挂接错误等)及应用程序无法正常使用等问题的原盘,则查找原数据重新制作光盘。 对于在检查中发现病毒的原盘,如能查找到原数据,则重新拷贝原数据后制作光盘;对于原数据查找困难的,暂不予复制归档。因此,为防止病毒感染、扩散,刻录与校验计算机必须分开使用,二者不允许混用。且校验计算机应与X络保持物理隔离状态。如刻录与校验电脑不分开使用,可能危及档案数据安全。在本次校验过程中,确实发现个别光盘带有攻击性病毒,严重感染电脑至系统瘫痪并且不易清除的情况。 2.光盘刻录
为提高工作效率,且保证复制过程中档案数据的安全性,本次复刻使用光盘刻录塔。光盘刻录塔的工作原理是首先从CD-ROM或DVD-ROM驱动器中读出原盘数据镜像到硬盘上,然后再将数据分多路传输到各个刻录机,控制所有的刻录机同步刻录CDR/DVDR盘片,由于使用了高速硬盘,所以数据传输快,不易产生缓冲器欠载运行错误,提高了拷贝的成功率。且因其不通过计算机设备连接,随读随刻,可以保证在不受外界病毒、系统环境干扰情况下形成与原盘数据存储模式完全一致的新盘。出现的问题主要是刻录光驱有寿命限制,在以32倍速连续刻录状态下,平均每个独立光驱能够正常刻录新盘数约为800张,超出此数字后其所刻录盘坏盘率逐渐升高,需适时更换光驱,保证刻录质量。 在刻录介质选择上,我馆本次使用SONYDVD-R1×-16x4.7GB/120min/DMR47C3、DMR47S3和SONYCD-R1×-48x700MB/CDQ80CG,经观察计算,以32倍速刻录,容量500M计,CD刻录时间平均为3分钟;以容量4.0GB计,C3型号DVD盘片刻录时间平均为9分钟,S3型号DVD盘片刻录时间平均为5分半。 以上数据显示,在实际中同品牌不同型号的光盘刻录速度尚有差异,不同品牌之间差异性应更大,在确定刻录介质前应在多种品牌和同种品牌不同型号光盘间分别做横纵向测试比较,依据相关要求选择各方面主要指数达标、安全性高、性价比合适的介质。 在复刻期间,第三方检测机构曾就随机给出的4种品牌(包含档案级光盘)的光盘进行检测,不同型号、品牌间的评测数据差值最多高达百倍以上。建议如采用光盘作为承载介质,应先取多种光盘到第三方机构评测,然后在保证档案数据安全性的前提下决定使用何种光盘。另因光盘本身亦有有效使用期限,应在采购时要求每批次光盘都附带主要参数检测报告、产品合格证等文件,以便于确定光盘的质量是否符合标准,也为后续归档存储确定存储条件及检测光盘的时间周期等工作做好准备。 在刻录结束后填制“数字化档案光盘数据迁移登记表”,存档备查。 3.编号标识 本次复刻工作盘面绝大多数采用黑色光盘笔标识,少部分盘面采用红色光盘笔标识。在查阅相关资料后,确定采用黑色光盘笔,一是黑色为对光盘表面涂层影响最小的颜色,二是专用光盘笔有利于标识的稳定性和统一性。少部分采用红色光盘笔的原因是原盘表面已有文字,为与原文字区分,而使用对盘面影响次小的红色。
4.光盘目录数据库及封面标识制作 针对原有光盘档案目录实际内容和存储格式标注不清、不全,未统计实际容量等不完善之处,我馆根据新制定的《北京市朝阳区档案馆馆藏归档光盘编号规则》新增了数据库及封面中光盘内容、存储格式和实际容量等项,并补充了原光盘内容描述,以便于利用查询和对馆藏档案相关数据的统计。见下图。 .17. 存在的问题有,部分光盘内容过多过长,在题名中无法记全,需留在备注里,但该部分内容从Excel导入Access中时显示出现错误。例如数码照片光盘中记录了一年度内多项活动照片,为了日后查找利用方便,此次复刻过程中把光盘里包含的内容全部记录了下来,由于题名较长,无法在数据库题名项中全部体现,只能在备注栏内体现,这样可能会导致日后查全率的下降。 5.光盘校验 为提高整体工作效率,光盘校验工作安排在前几项工作全部完成之后。主要侧重于对光盘本身质量、可读性、病毒查杀以及应用程序可用性的校验。 为确保光盘档案数据最大程度安全,本次光盘校验采取100%逐盘校验,全部馆藏光盘(A、B、C)三套共4779张校验完毕后,经计算总坏盘率约为6.91%(总坏盘数/使用总盘数),低于7%,符合相关要求。校验所用光驱均与原刻录光驱区分,对于校验未通过的光盘按第一步骤中区分情况重新刻录。 三、对以光盘为存储介质档案发展趋势的一些看法
经实地调研得知,目前北京市档案馆已停止了对馆藏光盘档案多套备份的工作,主要原因在于光盘介质存储方式不稳定,且单盘容量较小,对于精度较高的单个大容量文件无法应对。我馆在本次工作中也出现相应问题,如转录馆藏录像带,将其转换为通用的AVI或MPGE格式后,单个文件大小几乎都超过单张光盘容量,为将其刻录成光盘,需要将原文件切割成两到三个甚至更多个文件分盘刻录,此做法显然不利于档案文件的完整性保存。 因此,光盘自身的局限性决定了其只能作为部分档案阶段性保存方法,通过我馆开展此项工作的经验,从长期看应选择容量更大、更稳定的介质保存档案数据,现有的仅以光盘形式存储的档案数据也应尽早选择其他相对更稳定的介质备份存放,以确保其安全。 单位:北京市朝阳区档案局