Big Data: Der neue Goldrausch?

PrintFriendly and PDF


Big Data ist jetzt in den Massenmedien angekommen. Was ist dran am neuen „Goldrausch“?

Diese Woche titelt Die Zeit im Wirtschaftsteil mit einem Schwerpunkt zu Big Data. Die Kernaussage lautet, dass sich mit großen Datenmengen jetzt Geld verdienen lässt. Gleichzeitig schätzt Gartner im aktuellen Hype Cycles Report 2012, dass Big Data kurz vor dem Höhepunkt des Hype-Zyklus steht. Das mit Big Data eng verbundene Thema Social Analytics soll seinen Höhepunkt schon hinter sich gelassen haben. Getreu des Hype-Zyklus stehen beide Themen somit kurz vor dem Tal der Enttäuschungen. Ist Big Data also schon wieder durch, sobald jeder darüber spricht?

Um welche Daten handelt es sich?

Es lohnt sich, genauer hinzuschauen und erst einmal zu unterscheiden, um welche Datenberge es geht, wenn von „Big Data“ die Rede ist. Dabei lassen sich zumindest Nutzdaten, Profildaten und primär statistische Daten unterscheiden.

Die Nutzdaten eines erfolgreichen Internetauftritts oder großen Unternehmens – Produkte, Adressen, Einstellungen und vieles mehr – werden schnell sehr umfangreich. Sobald ein Auftritt ein Millionenpublikum anspricht und die Besucher sich private Bereiche anlegen können und diese eventuell auch noch vernetzen, kommen klassische Datenspeicher wie relationale Datenbanken an ihre Grenzen. Große Datenmengen verarbeiten zu können, ist hier also unabdingbare Voraussetzung für den Auftritt an sich.

Profildaten entstehen beispielsweise, wenn ein Internetauftritt die Aktionen jedes Besuchers aufzeichnet, um möglichst viel Wissen über die Vorlieben der einzelnen Personen zu sammeln. Solche Profildaten werden ebenfalls schnell umfangreich, wenn die Aktionen der Besucher feingranular aufgezeichnet werden. Gleichzeitig lassen sich Profildaten gut monetarisieren, da die Werbeindustrie daran interessiert ist, Werbung möglichst zielgenau zu platzieren. Andererseits haben viele Menschen große Vorbehalte dagegen, dass ihr Verhalten aufgezeichnet wird und daraus Profile erstellt werden. Zumindest in Deutschland setzt das Datenschutzrecht enge Grenzen bei der Profilerstellung.

Im Gegensatz zu Profildaten sind primär statistische Daten keinen einzelnen Personen zugeordnet – das Verhalten einzelner Menschen lässt sich daraus also nicht ableiten. Vielmehr steht der Wunsch im Mittelpunkt, Zusammenhänge zu erkennen, die (noch) nicht explizit bekannt sind. Hierzu werden Ereignisse aufgezeichnet und diese mit Fakten verknüpft. Um ein Beispiel aus meinem aktuellen Projekt zu nehmen: Mit welchem Angelzubehör und mit welchen Angeltechniken lassen sich welche Fischarten aus welchen Gewässern zu welcher Tageszeit am besten angeln?

Auch bei statistischen Daten gilt, dass die Datenmengen umso größer werden, je mehr Informationen miteinander verbunden werden. Die größte Herausforderung liegt darin, aus den Daten Informationen abzuleiten und daraus explizites Wissen zu generieren. Dieses Wissen hat einen Wert, der monetarisiert werden kann – jedoch erheblich schwieriger als bei Profildaten.

Der Wert statistischer Daten kann darin bestehen, die eigenen Geschäftsprozesse und Angebote zu prüfen und zu optimieren. Oder das generierte Wissen selbst findet Abnehmer, beispielsweise in Form von Markt- oder Konsumentenanalysen. In jedem Fall besteht die Schwierigkeit darin, überhaupt die richtigen Fragen zu stellen, um in den Datenbergen nützliche Informationen zu finden.

Daher vermute ich, dass sich viele Hoffnungen über die Wertschöpfung von Big Data zunächst einmal nicht erfüllen. Es wird noch eine Weile dauern, bis ausreichend Erfahrung vorliegt, die richtigen Fragen zu stellen, und bis die Tools ausgereift sind, diese Fragen effizient zu beantworten. Langfristig wird Big Data jedoch für jedes große Unternehmen zum Alltag gehören, um konkurrenzfähig zu bleiben.

Was bedeutet „Big Data“ für einen Software-Entwickler?

Aus technischer Sicht ist die Unterscheidung zwischen verschiedenen Arten von Daten wichtig, um für jedes Problem die jeweils passende Technologie auszuwählen. Der Anspruch „One size fits all“ kann von den heute vorhandenen NoSQL-Ansätzen jedenfalls nicht eingehalten werden.

Daher ist es wichtig, in einem Big Data-Projekt zu Beginn zu verstehen, mit welchen Arten von Daten man zu tun hat und welche Fragen zukünftig gestellt werden. Auf dieser Grundlage macht es erst Sinn, die verfügbaren Produkte zu sichten und einzugrenzen.

Aus Sicht eines Software-Entwicklers bringt Big Data also große neue Herausforderungen mit sich. Gleichzeitig gibt es viele faszinierende Lösungen, mit denen sich die eigene Werkzeugkiste bestücken lässt. Oder kurz gesagt: Selten war IT spannender als heute!