Jewiki unterstützen. Jewiki, die größte Online-Enzyklopädie zum Judentum.

Helfen Sie Jewiki mit einer kleinen oder auch größeren Spende. Einmalig oder regelmäßig, damit die Zukunft von Jewiki gesichert bleibt ...

(Spendenkonto siehe Impressum). Vielen Dank für Ihr Engagement!

Google Bücher

Aus Jewiki
Wechseln zu: Navigation, Suche
Google Bücher
Logo
books.google.de
Kommerziell Ja
Beschreibung Online-Buchsuche
Eigentümer Google Inc.
Erschienen April 2005

Google Bücher (Eigenbezeichnung Google Buchsuche; umgangssprchlich meist 'Google Books' genannt) ist eine Dienstleistung des US-amerikanischen Unternehmens Google Inc. mit dem Ziel, das in Büchern gespeicherte Wissen der Welt vorwiegend durch Digitalisierung für die Volltextsuche verfügbar zu machen.

Beschreibung

Google Bücher speist sich aus zwei Quellen:

  • Google Print im engeren Sinn, dem – nicht weiter kontroversen – Kooperationsprojekt mit Verlagen, und
  • Google Library, bei dem Bücher großer akademischer Bibliotheken auch ohne vorherige Zustimmung der Rechteinhaber massenweise gescannt werden, was juristisch umstritten war und ist.

Geschichte

Im Oktober 2004 präsentierte sich Google Print auf der Frankfurter Buchmesse vor (Pressekonferenz mit den Firmengründern Sergey Brin und Larry Page). Erste Berichte über Google Print gab es im gleichen Monat. Im Dezember 2004 begannen Suchergebnisse aus gescannten Büchern in den Ergebnislisten der englischen Suchoberfläche Google.com zu erscheinen. Google möchte bis 2015 15 Millionen Bücher (entspricht 4,5 Milliarden Seiten) gescannt haben.

Seit April 2005 existiert eine eigene Suche für die Inhalte des Programms.

Im Oktober 2005 präsentierte man zur Frankfurter Buchmesse deutsche und anderssprachige Benutzungsoberflächen.

Am 4. November 2005 wurde die Suchseite, nunmehr mit einer erweiterten Suche versehen (Abfrage nach Zeiträumen nun möglich), offiziell vorgestellt.

Am 17. November 2005 kündigte Google die Umbenennung des Dienstes in seinem Firmen-Weblog an.[1] Seit diesem Zeitpunkt werden Anfragen von print.google.com nach books.google.com weitergeleitet.

Im September 2008 kündigte Google an, gemeinsam mit nordamerikanischen Zeitungsverlagen Zeitungen zu digitalisieren. Die digitalisierte Version sollen durchsuchbar sein, mit dem Webbrowser navigierbar und erscheinen wie in der Printausgabe mitsamt den Fotografien, Schlagzeilen und Werbeanzeigen.[2]

Inzwischen gibt es bei einer Reihe von Büchern eine Kooperation mit Internet Archive. Dort gibt es Ausgaben in verschiedenen Formaten, für das PDF wird auf Google verwiesen (wo es für Werke nach 1864 für Nicht-US-Nutzer dann nicht verfügbar ist, siehe Kontroversen).

Kooperation mit den Verlagen

Google erhält von den Verlagen Bücher oder bekommt PDF-Dateien zugesandt. Die Bücher werden gescannt und durch OCR als E-Texte in den Index aufgenommen. Nutzer können jeweils nur vergleichsweise wenige Seiten des einzelnen Buchs einsehen. Nach einigen Seiten können nur (kostenfrei) registrierte Nutzer eine Anzahl weiterer Seiten einsehen. Eine Reihe von Seiten ist von vornherein für den Zugriff gesperrt. Nach Erschöpfung des Tageskontingents können keine weiteren Seiten betrachtet werden. Frei zugänglich sind in der Regel das Inhaltsverzeichnis, nicht selten auch das Register.

Google versucht die Inhalte durch eine Art Kopierschutz (so genanntes „Digital Rights Management“ rsp. Digitale Rechtevergabe) zu schützen.

Dass dies jedoch nicht immer vollständig angewandt wird, kann man an verschiedenen Fachbüchern problemlos nachvollziehen[3]. Angeschaute Seiten lassen sich nach dem Anzeigen im Internet-Browser mittels bestimmter Methoden dann sogar aus dessen Browser-Cache herauslesen und können mit entsprechenden Tools dann zu einer PDF-Datei zusammengeführt werden.

Kooperation mit Bibliotheken

Google scannt seit etwa 2005 den kompletten Bestand der Bibliothek der University of Michigan (über 7 Millionen Bände) einzuscannen sowie große Teile der US-Universitätsbibliotheken der Harvard University und der Stanford University, der New York Public Library sowie in Europa der Bodleian Library der Oxford University. Auch die Bibliotheken der University of Virginia, der University of Wisconsin-Madison, der Princeton University, der University of California und der University of Texas at Austin beteiligen sich.

Ende 2006 traten zwei weitere Institutionen dem Verbund der Bibliotheken bei, die Bücher bei Google digitalisieren lassen: Die Nationalbibliothek von Katalonien (Biblioteca de Catalunya) in Barcelona und die Bibliothek der Universidad Complutense Madrid.

Am 6. März 2007 gab die Bayerische Staatsbibliothek in München bekannt, als erste deutsche Bibliothek mit dem Projekt zu kooperieren. Es sollen nun etwa eine Million urheberrechtsfreier Werke aus den historischen Beständen und aus Spezialsammlungen digitalisiert werden.[4] Ausgenommen von dem Digitalisierungsprojekt sind nur die Handschriften- und Inkunabelbestände sowie seltene und besonders wertvolle historische Drucke.[5]

Im Juli 2008 gab die Bibliothèque Municipale de Lyon als erste französische Bibliothek bekannt, ihre Bücher digitalisieren zu lassen.[6]

Am 15. Juni 2010 gab die Österreichische Nationalbibliothek (ÖNB) bekannt, dass Google ihren urheberrechtsfreien Buchbestand digitalisiert. Die Kosten für die Digitalisierung der rund 400.000 Bücher betragen etwa 30 Mio. Euro und werden von Google getragen. ÖNB-Generaldirektorin Johanna Rachinger bezeichnete dieses Vorhaben als eines der größten Public Private Partnership in der österreichischen Kulturlandschaft. 400.000 Bände vom 16. bis ins 19. Jahrhundert (mit Ausnahme jener Bücher, bei denen konservatorische Bedenken dagegen sprechen) sollen dabei im Volltext erfasst werden – rund 120 Millionen Buchseiten sind danach online und kostenlos abrufbar.[7]

Heftige Kritik von Autoren- und Verlegerseite brachte Google dazu, das Scannen von urheberrechtlich geschützten Büchern bis November 2005 auszusetzen. Bis zu diesem Zeitpunkt sollten die Rechteinhaber angeben, welche Bücher sie nicht zugänglich gemacht haben möchten (Opt-Out-Lösung). Während Google sich auf den fair use des US-Rechts beruft und dabei von renommierten Juristen unterstützt wird, fordern die Verleger und Autorenverbände, dass kein Buch ohne Zustimmung ins Programm eingestellt wird (Opt-In). Im Oktober 2005 wurden in den USA Klagen von Autoren und Verlegern gegen Google eingereicht.

Anwendung in der Forschung

Ein im Dezember 2010 in Science veröffentlichter Aufsatz berichtet über die Möglichkeiten, Google Books zur quantitativen Analyse von Kultur zu nutzen (Culturomics). Den Wissenschaftlern standen für ihre Analysen etwa 4% aller Bücher, die jemals gedruckt wurden, zur Verfügung. Sie konvertierten die Bücher in eine massive Datenbank der in den Büchern enthaltenen Wörter (N-Gramm). Die Herangehensweise lasse sich für Forschungen auf verschiedenen Gebieten nutzen, wie Lexikographie, Evolution von Grammatik, kollektivem Gedächtnis, Technologieadoption, Ruhm, Zensur, oder historischer Epidemiologie. Das Forscherteam schätzte z.B. auf Basis der Datenbank, dass sich die Größe des englischen Wortschatzes innerhalb des letzten Jahrhunderts fast verdoppelte. In einer anderen Untersuchung wurde der kulturelle Einfluss Freuds mit dem Darwins verglichen. Freud verlor an Einfluss; Darwin überholte Freud im Jahr 2005.[8][9]

Kontroversen

Bitte Belege für diesen Artikel bzw. den nachfolgenden Abschnitt nachreichen!

Datei:Google Books scanfehler.png
Scanfehler in einem 2008 in der Bayerischen Staatsbibliothek München von Google gescannten Buch

Probleme der Auswahl der Digitalisate

Ein vehementer Kritiker in Europa ist der ehemalige Direktor der Französischen Nationalbibliothek, Jean-Noël Jeanneney, der mit Gallica ein freies europäisches Digitalisierungsprojekt betreibt. Er befürchtet, dass durch die englischsprachige Ausrichtung des Projekts die europäischen Sprachen ins Hintertreffen geraten könnten und warnt vor der „Google-Arroganz“ und der Dominanz einer Hypermacht.[10] Der Historiker Jeanneney plädiert dafür, dass Europa eine Alternative zum Google-Digitalisierungsprojekt auf die Beine stellt. An Google kritisiert er vor allem die Hegemonie des Englischen und den Kumulationseffekt (bei ihm genannt die „Blickfang-Methode“, üblich ist der Begriff „Ranking“, siehe: PageRank), der dazu führe, dass im Kampf um die Aufmerksamkeit des Lesers eine gewollte Konzentration auf die Listenführer stattfinde. Der stärkere Anbieter wird immer noch stärker auf Kosten des Schwächeren. Dadurch werde Google besonders für die Werbung wichtig. Diesem „kapitalistischen“ Google-Prinzip möchte Jeanneney ein Modell entgegensetzen, bei dem der Staat das Sagen in Dingen des kulturellen Gedächtnisses hat. 19 National- und Universitäts-Bibliotheken in Europa haben den Appell der französischen Nationalbibliothek unterzeichnet, um eine drohende geistige und kulturelle Vorherrschaft der USA zu verhindern.

Dieses Problem hat sich mittlerweile zumindest aus deutscher Sicht relativiert. Inzwischen sind sehr viele deutschsprachige urheberrechtsfreie Werke digitalisiert.

Probleme bei den Suchfunktionen

Die Suche erfolgt nicht wie in einem Bibliothekskatalog. Mit der einfachen Suchmaske erfolgt eine Volltextsuche über die Buchinhalte, nur die „Erweiterte Buchsuche“ ähnelt einem Bibliothekskatalog. Wer bestimmte Bücher suchen will, muss die Felder „Titel“ und „Autor“ ausfüllen. Die Buchsuche ist auch in dieser Suchmaske mit Mängeln behaftet. So gibt es keine Normierung der Ansetzung. Es wird nicht zwischen Monographien und Periodika unterschieden. Mehrbändige Werke, verschiedene Auflagen eines Werkes oder die Bände einer Zeitschrift erscheinen in zufälliger Reihenfolge und lassen sich nicht numerisch sortieren. Ob ein bestimmtes digitalisiertes Werk in der Ergebnisliste erscheint, ist von Zufällen abhängig, die der Benutzer nicht durchschauen kann.

Eine Zuordnung von systematischen Sachgruppen und Schlagworten zu den Büchern wie in Bibliothekskatalogen erfolgt nicht. Bücher eines bestimmten Fachgebietes zu selektieren, ist nicht möglich. Google geht davon aus, es genüge für die thematische Suche, alle Wörter in den Büchern zu erfassen. Die Eingabe eines Stichworts kann aber immer nur Ergebnisse in der verwendeten Sprache liefern. Es wird nicht berücksichtigt, dass oft auch sprachübergreifend gesucht wird und dass ein Wort in mehreren Fachgebieten verwendet werden und unterschiedliche Bedeutungen haben kann.[11]

Probleme bei der Texterkennung

Der Spiegel bemängelte die oft miserable OCR-Qualität und die mangelhaften Metadaten.[12]

Obwohl die Digitalisierung vielfach per Hand erfolgt, unterlaufen gravierende Fehler. So werden Klapptafeln fast immer in zugeklapptem Zustand aufgenommen. Häufig fehlen Seiten oder sind unleserlich, nicht selten verdeckt auch ein Finger oder die Hand des zum Umblättern eingesetzten Personals den Text.

Die Texterkennung von google wird teils über das ganze Buch, teils über Teile des Buches, teils über das Inhaltsverzeichnis, teils nur über Teile des Inhaltsverzeichnisses durchgeführt. Sie liefert bei älteren Schrifttypen unbrauchbare Ergebnisse, und zwar bei englischen Texten ebenso wie bei französischen und deutschen. Es gibt Fälle, in denen sogar der Autorenname vom OCR falsch erkannt wurde, so dass das Werk unter dem Autorennamen nicht gefunden werden kann.[11]

Probleme des Copyright

Mitglieder des Konkurrenzprojektes der Open Content Alliance kritisieren das Vorgehen von Google, das keine Rücksicht auf Copyright nehme.

In Deutschland fordern im Heidelberger Appell Schriftsteller, Verlage, und Wissenschaftler den Schutz des Urheberrechts gegen seine Aushöhlung. In dem Manifest zwei Dinge miteinander verbunden: Die Kritik an der Google-Buch-Digitalisierung mit einer Kritik an Open-Access-Politik im Allgemeinen. Dies hat zu einer Zersplitterung der Kritiker des rasch voranschreitenden Google-Digitalisierungsprojekts geführt. Ein großes Problem sieht der Heidelberger Appell insbesondere im so genannten Google Book Settlement.

Google Book Settlement

Das Google Book Settlement[13] ist ein Vergleichsvorschlag, den die Firma Google auf eine Sammelklage US-amerikanischer Verlage und Autoren gegen sie ausgearbeitet hat. Sollte dieser Vergleich vor dem New Yorker Gericht zustande kommen, so betrifft er auch nicht-amerikanische Verlage und Autoren, da Google über das Internet weltweit erreichbar ist. Zudem könnten Autoren gegen die Vergleichsvereinbarungen nach amerikanischem Recht nicht mehr nachträglich prozessieren, sofern sie sich nicht zuvor durch individuellen Einspruch aus der Sammelklage ausgeschlossen haben.[14][15][16] Google könnte dann jedes Werk deutschsprachiger Autoren, die keinen Einspruch in den USA eingelegt haben, in digitalisierter Form auf seiner Plattform zur Ansicht stellen, ohne dass hiergegen noch rechtlicher Einspruch der Autoren möglich wäre.

Anfang Mai 2009 wurde das abschließende Anhörungsverfahren für das Google Book Settlement vom 11. Juli 2009 auf den 6. Oktober 2009 vertagt. Die Widerspruchsfrist für Verlage und Autoren („Nicht-Teilnahme-Frist“) wurde vom 5. Mai 2009 bis zum 4. September 2009 verlängert.[13] (Entgegen anderslautenden Gerüchten[17] bleibt es bei diesem Termin.)[18] Für den deutschen Buchmarkt hat die VG Wort einen eigenen Regelungsvorschlag ausgearbeitet. VG Wort kritisiert und klagt auf der einen Seite gegen Aspekte dieser möglichen Einigung vor einem amerikanischen Gericht. Auf der anderen Seite arbeitet die VG Wort auch mit Google bei der geplanten Umsetzung der Einigung zusammen.

Am 1. September 2009 kritisierte die Bundesregierung den Einigungsvorschlag. Sie forderte, dass man zumindest eine eigene Klasse für die deutschen Rechteinhaber bilden solle und diese von der pauschalen Einigung ausnehme. Zudem behindere Googles Copyright-Verletzungen und das Verhalten „Erst tun, dann fragen“ Projekte wie die europäische Online-Bibliothek Europeana, die Autorenrechte vorab wahre.[19]

In den USA kritisierte etwa die American Society of Journalists and Authors die Einigung als einen internen Handel zugunsten der daran Beteiligten.[18] Auch in der FAZ wird der Verdacht eines so genannten „Coupon-settlements“ nahegelegt, bei dem selbsternannte Klägeranwälte mit Google eine „Einigung“ aushandeln, um ein üppiges Honorar und eine marktdominierende Stellung für Google zu erreichen.[20]

Anlässlich einer Expertenanhörung durch die EU-Kommission am 7. September 2009 erklärte Google, auf die Bedenken von Verlegern und Autoren eingehen zu wollen und deren Vertreter an der Beaufsichtigung des Projekts Google Books zu beteiligen. In Europa urheberrechtlich geschützte und lieferbare Bücher sollen nicht ohne ausdrückliche Erlaubnis gescannt und online zugänglich gemacht werden.[21] Gleichzeitig kündigte die EU-Kommission an, das Urheberrecht ändern zu wollen, da aufgrund der Gesetzeslage nur die USA von den Vorteilen der Digitalisierung und Online-Vermarktung profitieren würden.[22]

Im September 2011 wurde bekannt:

„In a surprise move, authors’ groups slammed their one-time university partners with a lawsuit demanding that the schools’ surrender digital collections and stop working with Google (NSDQ: GOOG). The lawsuit opens a new phase in the fight over digital libraries and comes the same week that Google’s controversial books settlement is expected to die in court.[23]

Andere Projekte

  • Die Open Content Alliance u. a. mit Konkurrent Yahoo, dem Internetarchiv und der University of California hat im Rahmen der Open Library in großem Umfang Bücher katalogisiert und digitalisiert, als Open Content und unter strikter Wahrung des Urheberrechts.
  • Auch der Konkurrent und mögliche Partner von Google, das Internet-Versandhaus Amazon bietet gescannte Bücher im Volltext an, konzentriert sich jedoch auf aktuell im Handel erhältliche Bücher, und will damit den Verkauf gedruckter Bücher fördern. Mit seiner Suche „Search Inside the Book“[24] macht Amazon Titelseite, Klappentext, Inhaltsverzeichnis, Register und zwei Seiten vor und hinter einem Suchergebnis verfügbar.
  • Die Suchmaschine A9.com[25], eine Amazon-eigene Suchmaschine, die Microsofts Suchtechnologie mit Amazons „Search Inside the Book“ verknüpft, zeigt auf der Basis eines noch kleinen, englischsprachigen Katalogs, wie sich in eingescannten Büchern, Bildern und Websites übergreifend suchen lässt.
  • In Deutschland gibt es zwei große universitäre Digitalisierungszentren: in Göttingen und in München. Bis zum Mai 2006 wurden im Göttinger Digitalisierungszentrum 4.487.815 Seiten in 11.726 Bänden digitalisiert. Rund die Hälfte davon ist frei zugänglich. Das Göttinger Vorzeigeobjekt ist die Digitalisierung der Gutenberg-Bibel. Das Münchener Digitalisierungszentrum hatte im Februar 2010 ca. 184.000 Titel frei zugänglich im Netz bereitgestellt.
  • MINERVA
  • die Internetprojekte Wikisource und Project Gutenberg
  • Gallica
  • The European Library, eine europäische Initiative, die den Zugang zu den digitalisierten Werken der Mitgliedsländer verbessern soll.
  • Auch große Verlage wie Random House (Bertelsmann) beginnen, ihre Buchbestände zu digitalisieren und für Suchmaschinen auffindbar zu machen. Random House stellte im Februar 2007 Teile seiner Buchbestände (5.000 Titel, weitere sollen folgen) online.[26] Mit Insight ermöglicht das Unternehmen seinen Kunden eine festgelegte Anzahl von Seiten pro Titel zu durchsuchen.[27]
  • Seit Oktober 2007 ist mit Zeno.org eine weitere Online-Bibliothek verfügbar.
  • Libreka - Die deutsche Antwort des Börsenvereins des Deutschen Buchhandels auf Google Book Search

Siehe auch

Einzelnachweise

  1. Jen Grant: Judging Book Search by its cover. Nov. 2005.
  2. Punit Soni: Bringing history online, one newspaper at a time. googleblog.blogspot.com 8. September 2008
  3. So steht von dem Buch „Active Directory für Windows Server 2008“ von Addison-Wesley, ISBN 978-3-8273-2740-6, an manchen Tagen fast der gesamte Inhalt des Buches offen im Internet
  4. Jens Redmer: The Bavarian State Library becomes largest non-English library partner. In: Inside Google Book Search. 6. März 2007, abgerufen am 11. März 2007.
  5. Klaus Ceynowa: Der ‚BSB-Google-Deal‘. Eine Million Bücher der Bayerischen Staatsbibliothek online in: BibliotheksMagazin. Mitteilungen aus den Staatsbibliotheken in Berlin und München, Nr. 1/2008, S. 3-7[1]
  6. Google digitalisiert Stadtbibliothek von Lyon, derstandard.at, 13. Juli 2008
  7. APA: Google digitalisiert Nationalbibliothek. In: Inside Google Book Search. 16. Juni 2010, abgerufen am 17. Juni 2010.
  8. John Bohannon: Google Opens Books to New Cultural Studies. Science, Vol. 330, 17. Dezember 2010. S. 1600.
  9. Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, Erez Lieberman Aiden: Quantitative Analysis of Culture Using Millions of Digitized Books. Science, Vol. 331, 16. Dezember 2010. S. 176-182.
  10. Michael Mönninger: Die Google-Bibliothek. in: Die Zeit. Hamburg 2005,32. ISSN 0044-2070
  11. 11,0 11,1 Für Beispiele siehe: Bücher suchen mit Google. In: Grüner Anzeiger, 12, November 2009, S. 30!
  12. Malte Herwig: Die entleibte Bibliothek. In: Der Spiegel, 12/2007, S. 186 f.
  13. 13,0 13,1 Google Book Settlement, Google
  14. Amerikanische Justiz prüft Googles Vergleich, F.A.Z, 29. April 2009
  15. Michael W. Perry: Alles hängt jetzt von Europa ab, F.A.Z., 5. Mai 2009
  16. Burkhard Hess: Es wird Zeit, dass die Bundesregierung eingreift, F.A.Z., 7. Mai 2009
  17. Die Frist sollte aus technischen Gründen vom Gericht bis zum 8. September verlängert werden.http://futurezone.orf.at/stories/1626350/
  18. 18,0 18,1 http://www.asja.org/google/
  19. http://www.spiegel.de/netzwelt/web/0,1518,646397,00.html
  20. http://www.faz.net/s/RubBE163169B4324E24BA92AAEB5BDEF0DA/Doc~E74446D08BF584F8D8725EB2BD5BDF90B~ATpl~Ecommon~Scontent.html
  21. Zugeständnisse an europäische Verlage? Focus Online, 7. September 2009
  22. EU-Kommission will das Urheberrecht novellieren Handelsblatt, 7. September 2009
  23. [ http://paidcontent.org/article/419-authors-to-universities-give-up-your-google-books/ paidcontent.org]
  24. Amazon „Search Inside the Book“
  25. A9.com
  26. Stuart Applebaum: Insight, newly launched digital search & browsing service to offer 5,000-plus Random House, Inc. U.S. titles (PDF-Datei; 31 kB), Pressemitteilung, 27. Februar 2007
  27. Insight Web Service, Random House

Literatur

Weblinks


Dieser Artikel basiert ursprünglich auf dem Artikel Google Bücher aus der freien Enzyklopädie Wikipedia und steht unter der Doppellizenz GNU-Lizenz für freie Dokumentation und Creative Commons CC-BY-SA 3.0 Unported. In der Wikipedia ist eine Liste der ursprünglichen Wikipedia-Autoren verfügbar.