Jewiki unterstützen. Jewiki, die größte Online-Enzyklopädie zum Judentum.
Helfen Sie Jewiki mit einer kleinen oder auch größeren Spende. Einmalig oder regelmäßig, damit die Zukunft von Jewiki gesichert bleibt ... Vielen Dank für Ihr Engagement! (→ Spendenkonten) |
How to read Jewiki in your desired language · Comment lire Jewiki dans votre langue préférée · Cómo leer Jewiki en su idioma preferido · בשפה הרצויה Jewiki כיצד לקרוא · Как читать Jewiki на предпочитаемом вами языке · كيف تقرأ Jewiki باللغة التي تريدها · Como ler o Jewiki na sua língua preferida |
Big Data
Big Data [ˈbɪɡ ˈdeɪtə] (von englisch big „groß“ und data „Daten“) bezeichnet Datenmengen, die zu groß oder zu komplex sind oder sich zu schnell ändern, um sie mit manuellen und klassischen Methoden der Datenverarbeitung auszuwerten. Der traditionellere Begriff im Deutschen ist Massendaten. Der Begriff „Big Data“ unterliegt als Schlagwort derzeit einem kontinuierlichen Wandel; so wird mit Big Data ergänzend auch oft der Komplex der Technologien beschrieben, die zum Sammeln und Auswerten dieser Datenmengen verwendet werden.[1][2] Die gesammelten Daten können aus nahezu allen Quellen stammen: angefangen bei jeglicher elektronischer Kommunikation, über von Behörden und Firmen gesammelte Daten, bis hin zu den Aufzeichnungen verschiedenster Überwachungssysteme.[3] Big Data können so auch Bereiche abdecken, die bisher als privat galten. Der Wunsch der Industrie und bestimmter Behörden, möglichst umfassenden Zugriff auf diese Daten zu erhalten, sie besser analysieren zu können und die gewonnenen Erkenntnisse zu nutzen, gerät dabei zunehmend in Konflikt mit Persönlichkeitsrechten des Einzelnen.
Hintergrund
Berechnungen aus dem Jahr 2011 zufolge verdoppelt sich das weltweite Datenvolumen alle 2 Jahre.[4] Diese Entwicklung wird vor allem getrieben durch die zunehmende maschinelle Erzeugung von Daten z. B. über Protokolle von Telekommunikationsverbindungen (Call Detail Record, CDR) und Webzugriffen (Logdateien), automatische Erfassungen von RFID-Lesern, Kameras, Mikrofonen und sonstigen Sensoren. Big Data fallen auch in der Finanzindustrie an (Finanztransaktionen, Börsendaten) sowie im Energiesektor (Verbrauchsdaten) und im Gesundheitswesen (Verschreibungen). In der Wissenschaft fallen ebenfalls große Datenmengen an, z. B. in der Geologie, Genetik, Klimaforschung und Kernphysik. Der IT-Branchenverband Bitkom hat Big Data als einen Trend im Jahr 2012 bezeichnet.[5]
Weitere Bedeutungen
Big Data bezeichnet primär die Verarbeitung von großen, komplexen und sich schnell ändernden Datenmengen. Als Buzzword wird der Begriff in den Massenmedien aber auch verwendet für
- die zunehmende Überwachung der Menschen durch Geheimdienste auch in westlichen Staaten bspw. durch Vorratsdatenspeicherung
- die Verletzung von Persönlichkeitsrechten von Kunden durch Unternehmen
- die zunehmende Intransparenz der Datenspeicherung durch Delokalisierung (Cloud Computing)
- der Wunsch der Industrie aus den vorhandenen Daten einen Wettbewerbsvorteil erlangen zu können
- die Automatisierung von Produktionsprozessen (Industrie 4.0, Internet der Dinge)
- die intransparente Automatisierung von Entscheidungsprozessen in Software[6][7]
- der Einsatz neuer Technologien statt Standardsoftware (insbesondere in Unternehmen mit einer konservativen IT oft durch Verwendung von Software as a Service um firmeninterne IT-Einschränkungen zu umgehen)
- die Entwicklung von eigenen Softwarelösungen („inhouse IT“) statt dem Einsatz von „off-the-shelf“ Software durch Fremdunternehmen
- Werbung, basierend auf Daten über die Internet- und Handynutzung
- die Organisation von Zusammenarbeit im Rahmen von People Analytics Projekten
selbst wenn in diesem Zuge teilweise weder große, noch komplexe Datenmengen anfallen.[8]
Beispiele
In der Forschung können durch Verknüpfung großer Datenmengen und statistische Auswertungen neue Erkenntnisse gewonnen werden, insbesondere in Disziplinen, in denen bisher viele Daten noch von Hand ausgewertet wurden. Unternehmen erhoffen sich von der Analyse von Big Data Möglichkeiten zur Erlangung von Wettbewerbsvorteilen, zur Generierung von Einsparungspotentialen und zur Schaffung von neuen Geschäftsfeldern. Staatliche Stellen erhoffen sich bessere Ergebnisse in der Kriminalistik und Terrorismusbekämpfung[9]. Beispiele, in denen man Vorteile erwartet, sind:
- Zeitnahe Auswertung von Webstatistiken und Anpassung von Onlinewerbemaßnahmen (wird aber bereits seit Jahren gemacht)
- Bessere, schnellere Marktforschung
- Entdeckung von Unregelmäßigkeiten bei Finanztransaktionen (Fraud-Detection – wird aber bereits seit Jahren gemacht)
- Einführung und Optimierung einer intelligenten Energieverbrauchssteuerung (Smart Metering)
- Erkennen von Zusammenhängen in der medizinischen Diagnostik
- Echtzeit-Cross- und Upselling im E-Commerce und stationären Vertrieb
- Aufbau flexibler Billingsysteme in der Telekommunikation
- Geheimdienstliches Erstellen von Bewegungsprofilen mit Programmen wie Boundless Informant
- Datenzugriff und -analyse auf raumzeitliche Rasterdaten in Wissenschaft und Industrie, beispielsweise nach dem Open-Geospatial-Consortium-Standard Web Coverage Service
- Vorhersage von Epidemien
- Verbesserungen der Arbeitsbedingungen für Mitarbeiter, etwa die Reduzierung von Burnout Raten, durch datenbasierte Change Projekte [10]
- Auffinden von Fachkräften durch datengestützte Webanalysen
- Verarbeitung von Daten aus Wettersatelliten und anderen naturwissenschaftlich eingesetzten Sensoren
Die reine Analyse von Kundendaten ist jedoch noch nicht automatisch Big Data – oft handelt es sich bei vielen Anwendungen aus dem Marketing viel mehr um „Small-Data“-Analytics.[8]
Verarbeitung von Big Data
Bitte Belege für diesen Artikel bzw. den nachfolgenden Abschnitt nachreichen! |
Klassische relationale Datenbanksysteme sowie Statistik- und Visualisierungsprogramme sind oft nicht in der Lage, derart große Datenmengen zu verarbeiten. Für Big Data kommen daher neue Arten von Datenspeicher- und Analyse-Systemen zum Einsatz, die parallel auf bis zu Hunderten oder Tausenden von Prozessoren bzw. Servern arbeiten. Dabei gibt es folgende Herausforderungen:
- Verarbeitung vieler Datensätze
- Verarbeitung vieler Spalten innerhalb eines Datensatzes
- Schneller Import großer Datenmengen
- Sofortige Abfrage importierter Daten (Realtime Processing)
- Kurze Antwortzeiten (Latenz und Verarbeitungsdauer) auch bei komplexen Abfragen
- Möglichkeit zur Verarbeitung vieler gleichzeitiger Abfragen (Concurrent Queries)
- Analyse verschiedenartiger Informationstypen (Zahlen, Texte, Bilder, ...)
Die Entwicklung von Software für die Verarbeitung von Big Data befindet sich noch in einer frühen Phase. Bekannt ist der MapReduce-Ansatz, der bei Open-Source-Software (Apache Hadoop und MongoDB) sowie bei einigen kommerziellen Produkten (Aster Data, Greenplum, u. a.) zum Einsatz kommt.
Kritik
Schwammiger Begriff und Hype
Der Begriff „Big Data“ wird für jegliche Art der Datenverarbeitung verwendet, selbst wenn die Daten weder groß, noch komplex sind oder sich schnell ändern; und mit herkömmlichen Techniken problemlos verarbeitet werden können.[8] Die zunehmende Aufweichung des Begriffs führt dazu, dass er zunehmend ein aussageloser Marketingbegriff wird und vielen Prognosen zufolge innerhalb der nächsten Jahre eine starke Abwertung erfahren wird („Tal der Enttäuschungen“ im Hypezyklus).
Fehlende Normen
Kritik gibt es an „Big Data“ vor allem dahingehend, dass die Datenerhebung und -auswertung oft nach technischen Aspekten erfolgt, also dass beispielsweise der technisch einfachste Weg gewählt wird, die Daten zu erheben und die Auswertung von den Möglichkeiten, diese Daten zu verarbeiten, begrenzt wird. Statistische Grundprinzipien wie das einer repräsentativen Stichprobe werden oft vernachlässigt. So kritisierte die Sozialforscherin Danah Boyd:[11]
- Größere Datenmengen müssten nicht qualitativ bessere Daten sein
- Nicht alle Daten seien gleichermaßen wertvoll
- „Was“ und „Warum“ seien zwei unterschiedliche Fragen
- Bei Interpretationen sei Vorsicht geboten
- Nur weil es verfügbar ist, sei es nicht ethisch
So ermittelte ein Forscher beispielsweise, dass Menschen nicht mehr als 150 Freundschaften pflegen (Dunbar-Zahl), was sodann als technische Begrenzung in sozialen Netzwerken eingeführt wurde – in der falschen Annahme, als „Freunde“ bezeichnete Bekanntschaften würden echte Freundschaften widerspiegeln.[11][12] Sicherlich würde nicht jeder alle seine Facebook-Freunde in einem Interview als Freunde benennen – der Begriff eines „Freundes“ signalisiert bei Facebook lediglich eine Kommunikationsbereitschaft.
Fehlende Substanz der Auswertungen
Ein anderer kritischer Ansatz setzt sich mit der Frage auseinander, ob Big Data das Ende aller Theorie bedeutet. Chris Anderson, Chefredakteur beim Magazin Wired beschrieb 2008 das Glaubwürdigkeitsproblem jeder wissenschaftlichen Hypothese und jedes Modells bei gleichzeitiger Echtzeitanalyse lebender und nicht lebender Systeme. Korrelationen werden wichtiger als kausale Erklärungsansätze, die sich oft erst später bewahrheiten oder falsifizieren lassen.[13]
Fehlende Regulierung
Der schleswig-holsteinische Datenschutzbeauftragte Thilo Weichert warnt: „Big Data eröffnet Möglichkeiten des informationellen Machtmissbrauchs durch Manipulation, Diskriminierung und informationelle ökonomische Ausbeutung – verbunden mit der Verletzung der Grundrechte der Menschen.“ [14][15]
Siehe auch
Literatur
- Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman: Mining of Massive Datasets. 2 Auflage. Cambridge University Press, Cambridge 2014, ISBN 978-1107077232. [Englisch]
- Yvonne Hofstetter: Sie wissen alles - Wie intelligente Maschinen in unser Leben eindringen und warum wir für unsere Freiheit kämpfen müssen, C. Bertelsmann Verlag, 15. September 2014, ISBN 978-3-570-10216-9[16][17][18]
- Heinrich Geiselberger und Tobias Moorstedt (Redaktion): Big Data. Das neue Versprechen der Allwissenheit (edition unseld SV Sonderdruck), Suhrkamp, Berlin 2013, 2. Auflage, ISBN 978-3-518-06453-5.
- Ramón Reichert (Hrsg.): Big Data: Analysen zum digitalen Wandel von Wissen, Macht und Ökonomie. transcript Verlag, Bielefeld 2014, ISBN 978-3-837-62592-9.
- Viktor Mayer-Schönberger: Big Data: die Revolution, die unser Leben verändern wird. Redline, München 2013, ISBN 3-86881-506-6.
- Ronald Bachmann, Guido Kemper, Thomas Gerzer: Big Data - Fluch oder Segen? Unternehmen im Spiegel gesellschaftlichen Wandels. Mitp, Heidelberg / München / Landsberg / Frechen / Hamburg 2014, ISBN 978-3-8266-9690-9.
- Klaus Mainzer: Die Berechnung der Welt: von der Weltformel zu Big Data. Beck, München 2014, ISBN 978-3-406-66130-3.
- Mario Martini: Big Data als Herausforderung für den Persönlichkeitsschutz und das Datenschutzrecht, DVBl. 2014, 1481–1489.
- Rudi Klausnitzer: Das Ende des Zufalls, wie Big Data uns und unser Leben vorhersagbar macht. Ecowin, Salzburg 2013, ISBN 978-3-7110-0040-8.
- Jaron Lanier: Wem gehört die Zukunft? „Du bist nicht der Kunde der Internetkonzerne. Du bist ihr Produkt“.. Hoffmann & Campe, 2014, ISBN 978-3-455-50318-0.
Weblinks
- Die Geschichte von Big Data – Max Planck Institut für Wissenschaftsgeschichte
- Big Data – Ausgabe 11-12/2015 von Aus Politik und Zeitgeschichte
- ABIDA Projekt - interdisziplinäres Forschungs- und Dialogprojekt zu den gesellschaftlichen Chancen und Risiken von Big Data, gefördert vom BMBF
- Big Data einfach erklärt – Erklärvideo bei Wikimedia Commons
Einzelnachweise
- ↑ President’s Council of Advisors for Science and Technology: “Big Data: Seizing Opportunities, Preserving Values”, Executive Office of the President, Mai 2014
- ↑ Edd Dumbill: “What is big data? An introduction to the big data landscape” vom 11. Januar 2012, gesichtet am 9. Mai 2014
- ↑ Fraunhofer IAIS: „Innovationspotenzialanalyse“ 2012, gesichtet am 13. November 2014
- ↑ Klaus Manhart: [[International Data Corporation|IDC]]-Studie zum Datenwachstum - Doppeltes Datenvolumen alle zwei Jahre. In: CIO. 12. Juli 2011, abgerufen am 11. Januar 2013.
- ↑ Trendkongress: Big Data, wenig Schutz. Abgerufen am 27. November 2012.
- ↑ Stefan Schulz: Wir und unsere virtuellen Zombies, FAZ, 15. September 2014, abgerufen am 19. Februar 2015
- ↑ Götz Hamann und Adam Soboczynski: Der Angriff der Intelligenz, Die Zeit, 10. September 2014, abgerufen am 19. Februar 2015
- ↑ 8,0 8,1 8,2 Fergus Gloster: Von Big Data reden aber Small Data meinen. Computerwoche, 1. Oktober 2014, abgerufen am 5. Oktober 2014.
- ↑ Hilton Collins: Predicting Crime Using Analytics and Big Data. 24. Mai 2014, abgerufen am 23. Januar 2014.
- ↑ Ben Waber: People Analytics: How Social Sensing Technology Will Transform Business and What It Tells Us about the Future of Work. Financial Times Prent. 2013. ISBN 978-0133158311
- ↑ 11,0 11,1 Danah Boyd: Privacy and Publicity in the Context of Big Data. (html) In: WWW 2010 conference. 29. April 2010, abgerufen am 18. April 2011 (english, Keynote WWW 2010).
- ↑ Marco Metzler: Die Mechanismen virtueller Beziehungsnetze. In: Neue Zürcher Zeitung. 16. November 2007
- ↑ Siehe auch: Chris Anderson in WIRED und cum hoc ergo propter hoc
- ↑ Weichert fordert Hinterfragung und Erforschung von „Big Data“. 18. März 2013, abgerufen am 21. März 2013.
- ↑ Big Data: Sowohl Gefahr für die Demokratie als auch ökonomische Chance. 20. März 2013, abgerufen am 21. März 2013.
- ↑ Stefan Schulz: „Sie wissen alles“, FAZ, 15. September 2014, abgerufen am 19. Februar 2015
- ↑ Vera Linß: Sachbuch über Big Data - Gefährliche Datenfusion, Deutschlandradio Kultur, 15. September 2014, abgerufen am 19. Februar 2015
- ↑ Götz Hamann und Adam Soboczynski: Der Angriff der Intelligenz, Die Zeit, 10. September 2014, abgerufen am 19. Februar 2015
Dieser Artikel basiert ursprünglich auf dem Artikel Big Data aus der freien Enzyklopädie Wikipedia und steht unter der Doppellizenz GNU-Lizenz für freie Dokumentation und Creative Commons CC-BY-SA 3.0 Unported. In der Wikipedia ist eine Liste der ursprünglichen Wikipedia-Autoren verfügbar. |