欢迎来到安庆市档案局!
  • 站内查询:
     
  • 电子文件中心建设
    电子文件长期保存格式需求
    发布时间:2013-04-02 14:50 | 访问次数:

          次

     


     

    制定本标准的目的是确定电子文件长期保存格式应具有的特性,为选择电子文件长期保存格式提供依据,保证电子文件的长期可读、可解析、可理解,降低电子文件管护成本。
    本标准附录A为资料性附录。
    本标准由国家档案局提出并归口。
    本标准起草单位:安徽省档案局(馆)、北大方正技术研究院。
    本标准主要起草人:黄玉明、王学武、胡华平、周建武、邓晓文、段丽琼、吴彬松、华婷、陈姗姗。


     

    本标准明确了电子文件长期保存格式的需求。
    本标准适用于各级档案馆、机关、企业、事业单位和其他社会组织电子文件的长期保存。
    下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
    GB/T 18894-2002 电子文件归档与管理规范
    ISO 15489-1:2001 信息与文献文件管理 第1部分 通用原则
    GB/T 18894-2002和ISO 15489-1:2001中确立的以及下列术语和定义均适合本标准。
    当电子文件保存在某一处所时,虑及技术变化(包括支持新载体、新数据格式)和用户群体变化影响的足够长的时段。这个时段延长到未来不确定的时间点。
    3.2 长期保存 long-term preservation
    用一种可靠的、能够被独立理解的方式长期(3.1)维护电子文件真实、完整、有效的行为。
    3.3 长期保存格式 long-term preservation format
    为长期保存(3.2)电子文件而选用的计算机文件格式。
    支持数字水印、数字签名、循环冗余校验或纠错码。
    格式开放,有公开发表的相应标准和技术规范。
    有与产品无关的技术专家组和标准化组支持该格式。
    被多种操作系统和应用软件支持。
    支持多种存储技术,或与存储技术无关。
    当用户不能使用指定产品软件时,可使用已有的插件读取。
    使用与设备无关的颜色规范实现准确打印和再现,不必考虑软硬件平台。
    不包含指定版本的格式之外的内嵌对象。
    不包含外部对象的链接。
    用标准格式(通常是XML)设置元数据,描述对象的属性特征,满足管理、保存、描述的需求。
    维持固定的文件页面、章节、段落的逻辑组织结构,不因软硬件平台和阅读器变化而变化。
    以自然阅读顺序提供文本,以便文件能用基本文本编辑工具阅读。
    不包含加密协议,也不包含加密选项。
    支持无损压缩。
    在压缩协议中不使用分辨率的缩减取样。
    支持其它格式转换为长期保存格式。
    支持过时的长期保存格式转换为新的长期保存格式。
    格式紧凑,数据结构合理,数据占用字节数少。
    支持在一个文件中容纳大量数据,不必把数据拆分成块。
    具有聚合能力,可以把几个相关的数字对象聚合到一个文件中。
    5 电子文件长期保存格式的选择原则
    电子文件长期保存格式应具有本标准第4章所列的长期保存格式的特性。满足电子文件长期保存的要求。
    符合相关的国际标准、国家标准或技术规范。
    被广泛应用和支持,采用的技术成熟、稳定,具有较强的生命力。
        符合国家信息安全政策,规避技术壁垒,维护信息安全。
    选定的长期保存格式尽可能使电子文件的管护成本最小化,这些成本包括使用、维护该格式软件费用、相关格式转换费用及人员培训费用等。
    符合本标准第4章所列特性的电子文件格式的数量可能是无限增长的,但特定电子文件保存处所接受的电子文件长期保存格式的数量应是有限的。
    当某类电子文件没有合适的长期保存格式时,可采用工业标准格式作为长期保存格式。
    认定电子文件长期保存格式,需要经过本标准一致性评估。
     


     

    附 录 A
    (资料性附录)
    常见电子文件格式
    表1 常见电子文件格式

    文件类型
    格式
    格式特征
    纯文本文件
    TXT格式
    格式简单透明、不含结构信息和加密、不绑定软硬件、能用基本文本编辑工具阅读、数据占用字节数少等。
    XML格式
    遵循XML技术规范,格式开放、不绑定软硬件、格式自描述、不包含加密、易于转换等。
    格式化文本文件
    UOF格式
    遵循GB/T 20916-2007《中文办公软件文档格式规范》,支持数字签名、格式开放、不绑定软硬件、格式自描述、不包含加密等。
    RTF格式
    格式开放、不绑定软硬件、不包含加密、易于转换等。
    WPS格式
    支持数字签名、可向其他文本格式转换等。
    版式文件
    PDF/A格式
    遵循ISO/DIS 19005《文件管理 电子文件长期保存格式 第1部分 PDF1.4的使用(PDF/A-1)》,支持数字签名、格式开放、不绑定软硬件、格式自包含、格式自描述、固定显示、不包含加密、可向其他文本格式转换等。
    CEB格式
    支持数字签名、格式自描述、固定显示、可向其他文本格式转换等。
    SEP格式
    支持数字签名、格式自描述、固定显示、可向其他文本格式转换等。
    图像文件
    TIFF格式
    支持无损压缩、不绑定软硬件、易于转换、聚合能力强等。
    JPEG-2000格式
    遵循ISO 15444-1:2004《信息技术 JPEG 2000图像编码系统 核心编码系统》,格式透明、支持无损压缩、不绑定软硬件、易于转换等。
    JPEG格式
    遵循相关标准规范,格式透明、不绑定软硬件、易于转换等。
    GIF格式
    支持无损压缩、格式透明、不绑定软硬件、易于转换等。
    PNG格式
    支持无损压缩、格式透明、易于转换等。
    DjVu格式
    格式透明、格式紧凑、具有聚合能力、数据占用字节数少等。
    音频文件
    WAV格式
    支持数字水印技术、支持无损或其他公开的压缩算法、易于转换等。
    MP3格式
    遵循GB/T 17191-1997《信息技术 具有1.5Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码》,压缩算法公开、格式紧凑、数据占用字节数少、易于转换等。
    WMA格式
    内置版权保护技术、格式紧凑、数据占用字节数少、易于转换等。
    OGG Vorbis格式
    格式透明、格式紧凑、数据占用字节数少、易于转换等。
    视频文件
    AVI格式
    支持数字水印技术、支持无损或其他公开的压缩算法、易于转换等。
    MOV格式
    格式紧凑、易于转换等。
    MPEG格式
    遵循GB/T 17191-1997《信息技术 具有1.5Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码》或GB/T 17975-2000《信息技术 运动图像及其伴音信息的通用编码》或 ISO/IEC 14496《信息技术 音视频对象编码》,压缩算法公开、不绑定软硬件、易于转换等。
    注1:表1所列的格式并非表示其通过了与本标准的一致性认证。
    注2:表1所列仅为部分常见格式,更多格式参见互联网媒体类型(IMT)。