Was ist Big Data?
Big Data bezeichnet eine große und exponentiell wachsende Menge an Daten, die für eine Vielzahl von Anwendungen genutzt werden können. Big Data ist nicht gleichbedeutend mit einer bestimmten Datenmenge. Bei der Nutzung von Big Data geht es jedoch meist um Terabytes, Petabytes oder sogar Exabytes an Daten, die im Laufe der Zeit verarbeitet und gesammelt werden. Je nach Anwendung stammen Big Data aus verschiedenen Quellen wie Transaktionsverarbeitungssystemen, Kundendatenbanken, medizinischen Aufzeichnungen, mobilen Apps und sozialen Netzwerken sowie aus maschinell erzeugten Daten, einschließlich Netzwerk- und Serverprotokolldateien und Daten von Sensoren in Produktions- und Industrieanlagen sowie IoT-Geräten (Internet der Dinge).
Big Data wird im Allgemeinen durch die 3 Vs charakterisiert: Volumen, d. h. die Datenmenge, Vielfalt, d. h. die vielen verfügbaren Datentypen, und Geschwindigkeit, d. h. die hohe Geschwindigkeit, mit der Daten empfangen und (möglicherweise) verarbeitet werden. Außerdem können große Datensätze strukturiert, halbstrukturiert und unstrukturiert sein. Big Data sind so umfangreich, dass sie mit herkömmlicher Datenverarbeitungssoftware nicht bewältigt werden können und daher auf die besonderen Anforderungen eines Unternehmens zugeschnitten werden müssen.