美国国会图书馆馆藏数码化与互联网服务

— 黄达维 David C. Huang,June 2010 USA

本文参考:美国国务院国际信息局报导

美国国会图书馆珍贵图书数码化
美国国会图书馆珍贵图书数码化

美国国会图书馆珍贵图书数码化

全世界最大的图书馆 – 美国国会图书馆(U.S. Library of Congress) “美国文献数字化(Digitizing American Imprints)”项目,至2009年底,已对将近六万册具有历史价值的珍贵图书进行了数码化扫描。其中许多书籍因古旧、易损而不便借阅使用。现在,凡需要了解美国早期历史或追溯自己家族历史的人,均可免费阅读并下载这些书籍。

迈克尔.汉迪(Michael Handy),项目负责人之一,指出:“许多馆藏书籍记录了1865年至1922年有关南北战争时期历史、美国西部移民史、郡、州和地区资料等,为历史学家提供了从其他渠道很难获得的宝贵资料。” 而1923年以前出版的书籍,因版权已过期失效,在美国已无版权限制。这批书籍中年代最久远的一本,出版于1707年,记录了对纽约两位长老会牧师的审判过程。第25,000本在2009年2月12日林肯诞辰200周年纪念日之前接受数字化扫描的书是1902年出版的一本儿童历史书:《伟大的解放者──亚伯拉罕.林肯英勇的一生》(The Heroic Life of Abraham Lincoln: The Great Emancipator)。

这些书籍的数码化扫描版本,可通过国会图书馆的检索网站“互联网档案馆”(Internet Archive – IA) 网站浏览或下载。

国会图书馆数码化扫描资料所包括的照片、地图、录音录像制品、报纸、信件和日记已经超过700万件,其中还包括深受欢迎的“美国往事(American Memory)”和多种语言的“全球通途(Global Gateways)”收藏专辑。



互联网档案馆 (Internet Archive)
互联网档案馆 (Internet Archive)

互联网档案馆(Internet Archive)

“互联网档案馆”是一个非营利组织,其宗旨是建立并管理一个不收费的网上数字图书馆。“互联网档案馆”是仅次于“谷歌图书(Google Books)”的世界第二大图书扫描工程。其创始人之一卡尔(Brewster Kahle)指出:“国会图书馆藏书的数量浩瀚、内容
精深,令人难以置信。现在,只要上网,就可以将所有这些书籍下载、打印或装订成册。” 除美国国会图书馆的藏书外,“互联网档案馆”还收集了已加入“开放内容联盟(Open Content Alliance)”的各个机构的藏书。“开放内容联盟”是一个国际性联合组织,其宗旨是致力于建立一个免费、多语言、数字化的文字以及其他多种媒体的资料档案库。

“互联网档案馆”对图书资料下载情况进行记录,以了解互联网档案的利用率。

“互联网档案馆”目前已包含中文古籍如《四库全书》。下列为《四库全书》子部的本草纲目,和集部的李太白文集的网上显示:

《四库全书》子部
《四库全书》子部
《四库全书》子部的本草纲目
《四库全书》子部的本草纲目
《四库全书》集部的李太白文集
《四库全书》集部的李太白文集
谷歌图书(Google Books)
谷歌图书(Google Books)

图书资料数码化的挑战性工作

美国艾尔弗雷德.斯隆基金会(Alfred P. Sloan Foundation)提供两百万美元赠款为启动国会图书馆的图书数字化工程提供了资金。这笔赠款的目的之一是建立一些程序和保护措施,因此能够扫描原本无法扫描的图书。国会图书馆还与提供扫描设备的“互联网档案馆”共同设置了专门的扫描仪,可以扫描地图等特大页的折页资料。

在扫描前和扫描后,图书馆员要对每一本书籍进行检查,以“保护鉴别(preservation triage)是否有损毁的情况。十位扫描工作人员坐在“Scribe”扫描仪旁。每一台扫描仪上方有两架数码相机对准放置在机械台面上打开的书页。扫描工作人员调整书页位置,以准确扫描,踩动脚踏开关拍下数字照片,然后再翻开下一页,逐一扫描。他们每一周可以扫描1000本书籍。在扫描完成并经过检查后,这些数码化书籍在几个小时内便可以上载到网站上供读者阅览。

扫描过的图书被送到马里兰州米德堡(Fort Meade)一个拥有空调的保存设施。这些书籍“将不再外借,而是被保护起来。

Share