2 数字资源保存的途径
本文所称数字资源是指通过数字技术制作并通过传统发行渠道发行或者通过互联网络向公众传播的各类离线和在线电子资源,包括原生的以个体实物形式出版和发行的电子出版物、以在线形式创作和传播的各类网络资料以及图书馆基于保存和保护目的而对馆藏纸本文献数字化所产生的数字副本。
从制度层面上讲,目前国际上有关数字资源的保存方式主要有两种,一种是出版物缴存制度,该制度又分为法定缴存(legal deposit)和自愿缴存(voluntary deposit)。法定缴存是指国家为保存本国出版文化遗产而由立法机关制定法律以强制本国缴存义务人(多为出版商)向法律指定的国家机构(多为国家图书馆)缴存一至数份出版物副本的法律制度(在英美法系国家,该项制度多规定在版权法中,如澳大利亚和美国的缴存制度);自愿缴存是指由出版商或者版权人依传统或者与负有保存文化遗产责任的国家机构或者类似机构签订协议缴存出版物或者其他有保存价值资料的一种民事法律行为。另一种是主动收割制——即负有保存数字资源职责的图书馆或者类似机构依据法律的授权或者依其职能主动收割和保存网络资料的一种资源采集行为,这也是国际图书馆界目前采取的争议最多、法律风险最大的数字保存行为。
作为一种与信息通讯技术、网络技术相伴而生且处于动态的发展和变化之中的文献资源,数字资源的保存一直受到许多国家的重视。但由于其在采集和保存过程中所涉及的问题众多,以致直到目前仍有一些关键性问题尚未形成定论(如技术和标准等),因而很难从立法上对因保存而形成的法律关系各要素予以明确规范。因此,自愿缴存就成为目前许多国家数字资源缴存的主要形式,但这种方式仅可作为特定历史时期对法定缴存制度的一种补充或者过渡;为确保所有有保存价值的文化遗产得到保存和保护,就必须适时修改、补充和完善现有法律。
3 澳大利亚图书馆的数字保存
澳大利亚现行有关保存国家文化资产制度的重要组成部分是出版物缴存,有关内容规定于版权法当中。根据联邦版权法的规定,出版者在澳大利亚境内出版的各类型出版物应向国家图书馆缴存一件副本。但目前这种强制性缴存机制并不适用于数字资源。[14]在无法律规范的情况下,澳大利亚的数字保存活动从一开始就带有很强的民间色彩。从上世纪90年代开始,由国家图书馆牵头的一批图书馆(包括教育机构的图书馆)就已开始尝试在协商基础上的数字资源自愿保存,多个有关数字保存的实验性项目陆续上马。
3.1 国家图书馆的“潘多拉”计划
潘多拉计划(Preserving and Accessing Networked Documentary Resources of Australia, PANDORA)是澳大利亚国家图书馆于1996年开始实施的一项以保存在线出版物和网页为主要内容的数字保存项目。该项目在实施过程中先后有十家机构参与,其中七家为公共图书馆。潘多拉计划有选择地保存并向公众提供与本国有关的具有文化意义和长期研究价值的在线出版物和网页内容,截至2008年12月16日,保存的文档数达61,584,632个,数据量达2.61TB。[15]根据该计划,各个参与机构分别负责某类数字和网站资源的采集和保存,如国家图书馆和州立图书馆负责其业务范围内的数字出版物和网站资源、国家电影和音乐档案馆(National Film and Sound Archive)负责与电影和音乐资料有关的数字出版物和网页资源、澳大利亚战争纪念馆(Australian War Memorial)负责战争史方面的数字资料、澳大利亚原住民及托雷斯海峡岛民研究会(Australian Institution for Aboriginal and Torres Strait Islander Studies, AIATSIS)负责有关澳大利亚原住民的数字资源和网络资源。为确保存档资源的质量,所有存档资料均须由各机构专职人员按照本机构的资源采选条例(selection guidelines)[16]人工采选。如潘多拉计划的采选条例[17]即规定,国家图书馆采集本国和国外服务器中的下列资源:(1)有关澳大利亚和所属各州及领地、澳大利亚人的资料;(2)有关澳大利亚社会、政治、文化、宗教、科学等主题或者具有经济意义的资料;(3)澳大利亚作者和被视为澳大利亚作者的作品。
除采集前列资源外,澳大利亚国家图书馆还与美国互联网档案馆(Internet Archive)合作,通过使用一个免费的离线浏览软件——HTTrack,分别于2005、2006和2007年对全部以.au为域名的网站进行了三次大规模的资源收割(收割的资源总量参见Table 1)。[18]与收割的资源总量相比,潘多拉采集保存的资源数量十分有限(参见Table 2)。这一方面说明,在庞杂的互联网资源中真正有保存价值的资源比例很小,这也在一定程度上凸显出制定适宜的采集标准、有选择地搜集和保存网络资源的必要性;而另一方面,收割的信息总量与保存量的巨大差异也促使国家图书馆重新审视和评估现行采集标准是否宽严得当。当然这需要在进行一些定向和定性方面的分析后方可得出结论。目前,澳大利亚国家图书馆正在就其实施的网页保存的范围、方法进行评估,包括调查域名收割时面临的法律和技术障碍,同时采取下列措施以限制和规避这种全域名收割所带来的法律风险: