Google图书

本页使用了标题或全文手工转换,现处于中国大陆简体模式
求闻百科,共笔求闻
Google图书
网站类型
数字图书馆
持有者Google
推出时间2004年10月,​19年前​(2004-10
现状营运中

Google图书(英语:Google Books)是一个由Google研发的搜索工具,它可以自Google所扫描、经由光学字符识别(OCR)、存储的数字化数据库中搜索资料。此服务于2004年10月在法兰克福书展发布,命名为Google Print。当用户使用关键字搜索,Google图书搜索的结果索引会显示在Google网络搜索服务的上方(Google.com)。用户还可以在Google图书搜索搜索书籍。点击Google图书搜索的结果索引打开页面,使用户可以查看书籍中的页面以及内容相关的广告,链接到出版商的网站和书店。Google以限制网页的浏览数量,来阻止书籍被打印和保护文字内容的复制版权,并追踪用户使用记录,作为通过各种准入限制和保障措施的依据。[1]

Google图书搜索允许公有领域的作品和内容,免费全文浏览,并提供PDF的格式下载。对于在美国境外的用户,Google必须确保它们的工作没有触犯到用户所在的国家的法律,根据Google图书搜索支持小组的成员说法:“一本书是否是在公有领域往往是一个棘手的法律问题,我们会谨慎的处理,直到我们确定本书已进入公有领域。”

关于扫描方面,许多书籍使用Elphel 323相机扫描,这种相机每小时可以照1000页。

而Google的这一项目受到极大称赞,它可能成为前所未有、全球最大的网上主体的人类知识,[2][3]但它仍有其潜在的批评——关于侵犯版权。[4]

项目目的

Google图书扫描图书的目的,并不是给人类阅读,而是用于训练人工智能[5]

扫描数量

Google曾表示,他们目前一天可扫描三千本书籍。到2007年3月为止,Google已经数字化100万本图书,根据纽约时报的估计,花费了约500万美元。在2008年10月28日Google说,通过此项服务,他们有700万本的图书被搜索,其中包括扫描的20000个出版商的合作伙伴。这700万册图书当中,100万基础上与出版商有“完全预览”的协议,100万属于在公有领域,以及其余500万是绝版或商用。[6]

竞争

  • 微软在2006年开发了一个类似的项目,名叫Live Search Books。它持续进行了一段时间,直到2008年5月该项目被取消。[7]所有的Live Search Books的资料,现已存在Internet Archive。Internet Archive是非营利性的,它是继Google之后第二大图书扫描项目。截至2008年11月已超过100万全文公有领域的作品扫描上网。
  • Europeana主宰约300万份的数字对象,其中包括影像、照片、绘画、音频、地图、手稿、印刷书籍、报纸等,这些文件超过一千项是由欧盟自过去两千年的欧洲历史搜集而成的。[8]

时间表

2004

  • 十二月:Google表明要扩张其Google Print项目,初期称为Google Print Library Project。Google宣布与几个知名的大学和公共图书馆创建伙伴关系,包括密歇根大学哈佛大学(哈佛大学图书馆)、史丹佛大学Green Library)、牛津大学博德利图书馆),以及纽约公共图书馆。根据新闻稿和各大学图书馆长所言,Google项目在十年之内数字化并提供约1500万册的Google图书搜索服务。Google动作之迅速引发了争议,因为出版商和作者协会都质疑Google项目进行的数字化,不仅是针对公共领域的图书,同时也挑战了著作权。

2005

  • 九月至十月间:两起对Google提出的诉讼指出,Google公司并不尊重版权,并且未能妥善补偿作者以及出版商。其一是集体作者诉讼代表(作家协会Authors Guild控诉Google,2005年9月20日);另一是五个大型出版商和美国出版商协会Association of American Publishers控诉的民事诉讼(McGraw Hill 控诉Google,2005年10月19日。)[4]
  • 十一月:Google将Google Print正式改名为Google图书搜索。这个方案使出版商、作者及他们在此服务中的书籍改了名,称为“Google Books Partner Program”(见Google Library Partners ),并且与图书馆的合作关系就成为了Google图书馆计划

2006

  • 八月:加州大学系统宣布它们将加入图书搜索数字化的项目。[9]
  • 九月:马德里Complutense大学图书馆成为加入Google图书项目的第一个西班牙语图书馆。
  • 十月:威斯康星大学麦迪逊分校宣布,它与威斯康星州历史学会的图书馆,将加入图书搜索数字化项目。合并后,图书馆馆藏变为720万册。
  • 十一月:弗吉尼亚大学加入该项目。该库包含超过5万册和1700多万份的手稿、珍贵书籍和文件。[10]

2007

  • 一月:在得克萨斯州大学奥斯汀分校宣布,它将加入图书搜索数字化计划。至少有一万册数字化将是由该大学的13个图书馆定位。
  • 三月:巴伐利亚州图书馆宣布与Google创建合作伙伴关系,来扫描超过100万份关于公共领域,和绝版的德语以及英语、法语、意大利语、拉丁语和西班牙语作品。[11]
  • 五月:一本数字化项目的书,被公告为Google及县立、洛桑大学图书馆所纳入。[12]
  • 五月:根特大学的Boekentoren图书馆,将参与Google图书数字化项目,且将把19世纪的图书制成法国和荷兰的语言并上线。[13]
  • 六月:合作委员会(Committee on Institutional Cooperation)宣布,其12个成员图书馆未来六年将参与扫描1000万本书的过程。[14]
  • 七月:庆应义塾大学成为Google在日本的第一个图书馆合作伙伴,他们将数字化至少12万本公共领域的书籍。
  • 八月:Google宣布,它将数字化达50万本有版权的书籍,也将数字化在康奈尔大学图书馆的公共领域书籍。Google还将提供一个系统,可将数字化复制的所有作品扫描并纳入大学自己的图书馆。[15]
  • 九月:Google增加了一个功能,允许用户在公共领域共享片段的书籍。
  • 九月:Google推出一项新功能,名为“我的图书馆”,允许用户创建个人体制的图书馆。他们可以运用标签、审查、利率、或全文检索来选择图书。[16]
  • 十二月:美国哥伦比亚大学成为一个数字化公共领域的伙伴。

2008

  • 五月:微软逐渐势衰,并打算结束其扫描项目。该项目扫描了75万份的书籍和八千万篇的杂志文章。
  • 十月:经过两年的谈判,出版业和Google终于达成协议。Google同意以补偿作者和出版商,换取有权将数以百万计的图书提供给公众。[4]
  • 十一月:Google和合作伙伴的图书扫描项目达到了700万大关。其中一百万已达成完全预览模式,另有一百万已是可完全浏览和下载的公共领域的作品。[17][18]

Google图书项目参与者

哈佛大学哈佛大学图书馆
牛津大学博德利图书馆
庆应义塾图书馆旧馆
纽约公共图书馆

参与项目的成员人数自Google图书馆计划实行之初已成长许多[19];迈索尔大学在许多媒体的报导都提到其为此计划之合作伙伴,[20][21]但他们实际上并没有被Google列为合作伙伴。[22]  

首批参与者

后期加入参与者

争议

违反著作权、合理使用等争议

出版业与作家协会批评该项目列入片段的作品是侵犯版权的行为。2005年秋季,作家协会和美国出版商协会分别控诉Google。Google反驳说,该项目的每个项目皆是合理使用,并且在这数字时代,每一个字都有对应到其出版索引。[4] 2006年6月,在诉讼之后,法国出版商宣布它打算控诉法国Google。[23]2006年底,德国控诉被撤回。[24]
2007年3月,Google被告侵犯著作权法的图书搜索服务。微软的副总兼法律顾问托马斯·鲁宾(Thomas Rubin)批评Google一再任意复制作品,并且总是直到有人出面指证才会停手。[25] 2008年11月28日,作家协会、出版界和Google签订了和解协议,Google同意支付总共1.25亿美元,包括诉讼费用及创建图书权登记处。该解决方案将在2009年5月得到法院的批准。[4]解决的反应有好有坏,其中一个与Google合作的图书馆表示,如果Google无法找到“更合理的条款”,它会选择撤回与其合作的关系。[26]

弗吉尼亚大学的副教授Siva Vaidhyanathan,以法律观点研究一已出版的见解[27],之后他指出Google该项目构成了危险的理论——合理使用,因为索赔的使用其实是不合理的,它可能会导致司法限制这一权利。[28]而之后作家协会控诉Google没有去法院,导致合理使用争端得不到解决方案。

Google许可的公有领域作品也是一个令人关注的议题。[29]一些出版作业是在公有领域进行的,例如美国联邦政府创造的所有作品,但那些作品仍被视如其他版权保护的作品般对待,导致它们在1922年之后遭禁。[30]

语言争议

一些欧洲政治家和知识分子批评Google有语言帝国主义倾向,理由是因为绝大多数的书籍都扫描成英文,这会导致英文成为世界代表性的自然语言,如此一来受欢迎的语文学例如德语、汉语、俄语、法语则会渐渐不被重视,并不公平。在这些批评声浪中出面表达意见的是法国国家图书馆馆长Jean-Noël Jeanneney[31]

Google图书搜索与Google学术搜索

当Google图书搜索大量的扫描一些过期学报、杂志时产生了一个问题,就是其扫描时并没有办法将元数据(metadata)也一并扫入。这使得Google学术搜索只好开办自己的数字化计划,并放置认同这个项目的出版社的过期期刊文章。[32]

参考资料

  1. Greg Duffy. Google's Cookie and Hacking Google Print. Kuro5hin. 2005-03 [2008-12-04]. 
  2. Bergquist, Kevin. Google project promotes public good. The University Record (University of Michigan). 2006年2月13日 [2007-04-11]. 
  3. Pace, Andrew K. Is This the Renaissance or the Dark Ages?. American Libraries. American Library Association. 2006-01 [2007-04-11]. Google made instant e-book believers out of skeptics even though 10 years of e-book evangelism among librarians had barely made progress. 
  4. 4.0 4.1 4.2 4.3 4.4 Copyright infringement suits against Google and their settlement: The original lawsuits in 2005:
  5. Dyson, George. Turing's Cathedral: The Origins of the Digital Universe. Knopf Doubleday Publishing Group. 2012: 312–313. ISBN 978-0-307-90706-6 (英语). 
  6. In Google Book Settlement, Business Trumps Ideals. PC World. 2008-10-28 [2008-10-31]. Of the 7 million books Google has scanned, 1 million are in full preview mode as part of formal publisher agreements. Another 1 million are public domain works. 
  7. Microsoft starts online library in challenge to Google Books. AFP. [2008-11-24]. Microsoft launched an online library in a move that pits the world's biggest software company against Google's controversial project to digitize the world's books. 
  8. Europe's Answer to Google Book Search Crashes on Day 1. Wired. 2008 [2008-11-24]. 
  9. UC libraries partner with Google to digitize books. [2008-12-04]. 
  10. The University of Virginia Library Joins the Google Books Library Project. 
  11. Bavarian State Library + Google digitizing project partnership announced. [2012-07-15]. 
  12. Reed, Brock. "La Bibliothèque, C'est Google" (Wired Campus Newsletter), Chronicle of Higher Education. May 17, 2007.
  13. Ghent/Gent + Google digitizing project partnership announced. [2008-12-04]. 
  14. CIC + Google digitizing project partnership announced. [2008-12-04]. 
  15. Cornell + Google digitizing project partnership announced. [2008-12-04]. 
  16. Google's "personal library" feature announced. 
  17. Massive EU online library looks to compete with Google. Agence France-Presse. 2008-11. Google, one of the pioneers in this domain on the other hand, claims to have seven million books available for its "Google Book Search" project, which saw the light of day at the end of 2004. 
  18. In Google Book Settlement, Business Trumps Ideals. PC World. 2008-10-28 [2008-10-31]. Of the 7 million books Google has scanned, 1 million are in full preview mode as part of formal publisher agreements. Another 1 million are public domain works. 
  19. 引证错误:<ref>标签无效;未给name(名称)为gblp1的ref(参考)提供文本
  20. Ars Technica. [2008-12-04]. 
  21. Hindustani Times "Google to digitise 800,000 books at Mysore varsity". [2008-12-04]. 
  22. Google Library Partners. 
  23. John Oates. French publisher sues Google. The Register. 2006年6月7日 [2008年12月4日]. 
  24. Danny Sullivan. Google Book Search Wins Victory In German Challenge (blog). Search Engine Watch. 2006年6月28日 [2006-11-11]. 
  25. Thomas Claburn. Microsoft Attorney Accuses Google Of Copyright Violations. InformationWeek. 2007年3月6日 [2008年12月4日]. 
  26. Google Online Book Deal at Risk. [2008-12-04]. 
  27. Siva Vaidhyanathan,. “The Googlization of Everything and the Future of Copyright,” University of California Davis Law Review volume 40 (March 2007), pp. 1207–1231, pdf
  28. First Monday Transcript September 2007
  29. Michael Liedtke. Publishers Protest Google's Online Library Project. Associated Press. 2005年5月24日 [2008年12月4日]. 
  30. Robert B. Townsend, Google Books: Is It Good for History? , Perspectives (September 2007).
  31. Jean-Noël Jeanneney. Google and the Myth of Universal Knowledge: A View from Europe (book abstract; Foreword by Ian Wilson). 2006年10月23日. ISBN 0-226-39577-4. 
  32. Barbara Quint : Changes at Google Scholar: A Conversation With Anurag Acharya Information Today, August 27, 2007

参见

外部链接