Als Big Data werden Datensammlungen in Datenbanken oder anderen Medien bezeichnet, die sich durch ihre immense Größe und Anzahl an Einträgen auszeichnen. Die Big Data Definition geht implizit davon aus, dass stetig neue Informationen zum vorhandenen Datensatz hinzukommen, oft sogar in Echtzeit. Die Verarbeitung und Auswertung dieses Datenvolumens ist mit herkömmlichen Anwendungen und Methoden nicht möglich.
Was ist Big Data?
Die Frage „Was ist Big Data?“ lässt sich nicht mit einer konkreten Anzahl an Datensätzen oder Einzeldaten beantworten. Vielmehr umfasst der Begriff wachsende Datenmengen in schier unvorstellbaren Dimensionen, die nicht mehr durch einfache Hilfsmittel wie das Anlegen statischer Tabellen erfasst werden können. Dies bringt neben Problemen in der generellen Datenerfassung Probleme bei der Datenanalyse sowie dem Import und Export der Daten mit sich.
Im digitalen Zeitalter entstehen sekündlich neue Daten in diversen Lebensbereichen, die technisch zu erfassen und verarbeiten sind. Hierfür werden Speichermedien in Dimensionen vieler Pentabyte benötigt, die es stetig zu erweitern gilt. Ein Beispiel für die Big-Data-Erfassung stellt der Börsenhandel an globalen Handelsplätzen dar, der stetig Kursveränderungen von unzähligen Werten und Indizes als veränderliche Datensätze erfasst, darstellt und zur Analyse und Verarbeitung bereitstellt.
Einsatzgebiete von Big Data
Big Data sind in allen Lebensbereichen anzutreffen, die digitalisiert wurden und stetig neue Datensätze hervorbringen. Diese Datensätze können durch menschliches Handeln, weltliche Entwicklungen oder digitale Technologien selbst entstehen. Einige Einsatzgebiete, in denen riesige Datenmengen stetig erfasst und verarbeitet werden, sind:
- Texte und Bilder in Social-Media wie Facebook oder Instagram
- Erstellung von Wettermodellen auf Basis stetig neuer Messwerte weltweit
- Technische Kontrollmessungen von Maschinen und Anlagen
- Analysedaten von Webseiten, Shops und ähnlichen Plattformen
Die Big Data Definition wird nicht alleine für die Daten selbst verwendet. Auch Technologien und Methoden, die für die Verarbeitung der Daten herangezogen werden, fallen unter diese Bezeichnung. Welche Methoden und Anwendungen hierfür geeignet sind, hängt wesentlich von den Zielsetzungen der Auswertung ab. Unerlässlich ist hierbei, sich auf wenige statische Parameter zu einigen, um Auswertungen zu einem bestimmten Zeitpunkt mit einem festgelegten Datensatz durchführen zu können.
Big Data Definition und Google
Die Erfassung riesiger Datenmengen durch Google und andere Suchmaschinen ist obligatorisch und steht immer wieder in der Kritik bezüglich des Themas Datenschutz. Auch einzelne Firmen haben sich bei der umfangreichen Datenerfassung von Kunden, Mitarbeitern oder Webseitenbesuchern an strenge Vorgaben im Sinne des Datenschutzes zu halten.
Im Gegenzug lassen sich die gesammelten Erkenntnisse für die eigene Online-Marketing-Strategie nutzen, um bessere Google-Rankings zu erzielen. Speziell bei der Erfassung von Kundenverhalten in Webseitenbesuch, Warenkauf & Co. lassen sich Schlüsse über sinnvolle und weniger sinnvolle Maßnahmen im eigenen Marketing ziehen. Welche Daten hierbei über die eigene Webseite erfasst werden, beispielsweise über das Speichern von Cookies, benötigt mittlerweile die explizite Zustimmung.