DATA & TARGETING

Die drei Wellen von Big Data

Von Matt Turck, 25. September 2012

In nur wenigen Monaten scheint Big Data von einem technisch-orientierten Thema, das eher bei Online-Nerds zu Hause war, zu einem globalen Phänomen mutiert zu sein, dessen Wellen weit über den Rand der Businesswelt bis in die Mitte der Gesellschaft schlagen: Zunächst wird alles, was wir tun, unsere Arbeit und unser Privatleben, digitalisiert und ausgewertet. Die Folge sind massive, umfassende Datenbestände.

Im Folgenden werden eben diese Datenbestände durch neue Technologien erstmals verarbeit- und skalierbar. Die Technologien geben das Versprechen, erstaunliche Insights über alles zu liefern, was wir als Menschen tun. Die Möglichkeiten von “Big Data” sind so groß, dass den beteiligten Kommentatoren längst sämtliche Metaphern à la “das neue Öl”, “das neue Gold” oder “die neue Grenze”, “neues Plastik”, “New Black” etc. ausgehen.

Aber was genau für Möglichkeiten bieten sich allen Entrepreneurs und Entwicklern? Ich persönlich sehe die Zukunft von Big Data und die damit einhergehenden Möglichkeiten als drei Wellen:

Die erste Welle: Big-Data-Infrastrukturen

Zurzeit dreht sich die Big-Data-Diskussion in erster Linie um Kerntechnologien. Wenn Sie sich die Programme der großen Datenkonferenzen ansehen, werden Sie in erster Linie Agendapunkte wie Software und Data Science finden. Ohne Frage faszinierend, aber doch sehr technisch und schwer zu verstehen für alle, die keinen tiefer gehenden technologischen Zugang haben. Obwohl die ersten Big-Data-Kernprodukte wahrscheinlich von nutzerorientierten Online-Unternehmen gekommen sind, ist von einer Nutzerorientierung momentan kaum etwas spürbar.

Der Grund dafür ist, dass wir noch am Anfang stehen und zunächst grundlegende Fragen der Big-Data-Infrastruktur lösen müssen, bevor wir die nächsten Schritte angehen können: Wie verarbeiten wir Big Data in Echtzeit? Wie können wir Datenströme bereinigen und skalierbar machen? Wie verarbeiten wir die großen Datenmengen in der Cloud? Wie simplifizieren wir den Prozess Big Data und machen es nutzbar für die Mehrheit der Tech-Unternehmen und Geschäftskunden? Genau um diese Fragen zu klären, ist die Arbeit an passenden Infrastrukturen notwendig.

Großartige Möglichkeiten für neue Unternehmen

Viele große etablierte Player haben enorme Probleme mit Big Data. Ihre vorhandenen Technologien sind einerseits oft ungeeignet und bauen andererseits darauf auf, wesentlich kleinere Datenmengen für ungleich sehr viel Geld zu verarbeiten. So ist es nicht verwunderlich, dass neue Anbieter ihre Dienste zu einem Bruchteil des Preises offerieren, den die Oracles dieser Welt normalerweise verlangen. Vor diesem Hintergrund machen aber auch große Unternehmen interessante Schachzüge (Oracle arbeitet mit Cloudera, Microsoft unterstützt Hadoop etc.). Es ist also sicher, dass sich für Start-ups und Investoren in den nächsten Jahren sehr interessante Möglichkeiten auftun.

Gleichzeitig ist diese Zeit aber auch eine Zeit der Verwirrung für alle, die das Erfolgsrezept für Big Data bereits jetzt entschlüsseln wollen:

- Die Störgeräusche wachsen mit jedem Euro an Investment, der in die Data-Industrie fließt. Auch der Fakt, dass sich viele große Unternehmen als Big Data Player rebranden, ist dafür nicht gerade hilfreich.

- Wir begegnen einer großen Zahl an* wissenschaftlichen Projekten, die sich zwar damit auseinandersetzen, das Infrastrukturproblem zu lösen, dabei aber gewinnorientierte Geschäftsmodelle vernachlässigen.
*
- Es wird einige Zeit in Anspruch nehmen, bis sich wirkliche Gewinner abzeichnen. Im Gegensatz zu consumer-orientierten Start-ups, die eine rasante Entwicklung von null auf hundert vollziehen können, brauchen Software-Start-ups generell länger, um die Etablierung ihrer IT-Produkte zu erreichen. Der vielerorts dokumentierte (wahrscheinlich temporäre) Mangel an Hadoop-Programmierern und Data Scientists wird diese Verlangsamung weiter verstärken.

- Das wahnsinnige Interesse in Big Data wird dann zu einer Desillusionierung** führen, wenn sich bestimmte Projekte als schwerer und zeitraubender erweisen, als erwartet. Diese Phase müssen engagierte Start-ups durchstehen.

Früher oder später aber werden sich die Gewinner herauskristallisieren. Was uns heute noch als technische Herausforderung erscheint, wird von jedem halbwegs qualifizierten Programmierer mit günstigen und einfachen Tools behoben werden können. Grundsätzlich ist das doch immer die Ironie aller wirklich guten und revolutionären Technologien: Der ultimative Stempel des Erfolges ist es, dass sie ab dem Punkt ihres Durchbruchs einfach vorausgesetzt und damit vor allem eines werden: langweilig.

Die zweite Welle – “Big Data enabled” – Applikationen und Features

Wenn alle grundlegenden technischen Fragen zur Infrastruktur beantwortet sind, bewegt sich die Aktivität auf das Level der Applikationen und hievt damit die Vorzüge von Big Data auf eine Ebene, wo es einer breiteren, nicht technikaffinen Zielgruppe innerhalb der beteiligten Industrie und schließlich auch für die Anwender selbst verfügbar wird.

In dieser Industrie werden wir die größte Innovation zunächst um Businessanwendungen selbst erleben, welche B2B-Kunden völlig neuartige Möglichkeiten des Data-Minings und der Datenanalyse liefern werden. Die Grundlage dafür sind große Mengen interner Daten, ihre Analyse in Echtzeit und darüber hinaus gegebenenfalls noch ihre Anreicherung mit externen Daten, die über Datenmarktplätze verfügbar werden.

Genau dies wird sich durch alle internen Bereiche der Industrie ziehen (Finance, Sales, Marketing, HR etc.) und natürlich auch durch alle Branchen, egal ob Handel, Gesundheit oder Finanzen. Die Möglichkeiten sind verführerisch: Wie zum Beispiel wird eine CRM-Lösung aussehen, wenn Daten über alle Kunden nicht nur in Echtzeit erhoben werden, sondern anschließend mit der Gesamtheit aller Sales-Aktivitäten sowie Industriedaten, geografischen oder demografischen Mustern abgeglichen werden können, um schließlich zu ermitteln, welche Kunden im nächsten Quartal wahrscheinlich erneut zum Käufer werden?

Auch auf der Seite der Nutzer selbst werden datengetriebene Services und Dienste im Web an der Tagesordnung sein. Internetunternehmen wie Amazon, LinkedIn, iTunes und viele andere haben dafür mit ihren Recommendation-Engines bereits den Grundstein gelegt. Bisher aber war es für solche Services nötig, selbst Datenspezialisten an Bord zu haben – und natürlich die passende Infrastruktur. Gerade in diesem Feld werden wir eine rasant voranschreitende Demokratisierung der verfügbaren Infrastrukturen für die gesamte Industrie erleben. Händler, Finanzdienstleister und Gesundheitsorganisationen werden alle über datengetriebene Features verfügen, um ihre Nutzer und Kunden personalisiert und gezielt ansprechen zu können.

Überhaupt jedes Unternehmen, das über eine irgendwie geartete Webpräsenz verfügt, wird datengetriebene Features einsetzen. Genau das ist wiederum ein sehr vielversprechender Ansatz für Start-ups, die sich auf “Out-of-the-Box”-Lösungen spezialisieren, um Big Data für jeden einfach verfügbar zu machen.

Die dritte Welle: Der Aufstieg datengetriebener Start-ups

Die Demokratisierung von Big-Data-Infrastrukturen bietet wiederum große Möglichkeiten für Entrepreneurs – besonders solche mit tiefem technischen Verständnis und dem Anspruch, vollständig neue, auf Big Data beruhende Geschäftsmodelle zu entwerfen.

Genau wie wir damals über online-basierte Geschäftsmodelle gesprochen haben werden wir in ein paar Jahren über big-data-basierte Unternehmungen reden. Damit meine ich Unternehmen, die die Verarbeitung großer Datenmengen in ihrer Core-DNA tragen und sie schließlich dazu nutzen, ein Produkt zu liefern, das ohne diese Daten nicht möglich wäre.

Natürlich gibt es auch jetzt schon Start-ups, die Data leben und atmen. Firmen wie WeatherBill, die umfassende Wetterdaten sammeln und darauf basierend Versicherungen verkaufen, Klout, die nicht ganz unumstritten datenbasierte Scores für den sozialen Einfluss von Usern ermitteln oder Wonga, die basierend auf Daten Kredite vergeben, sind nur einige frühe Beispiele.

Aber das ist erst der Anfang …

Data Days Gewinnspiel:

Und hier zum dritten und letzten Data Days 2012 Gewinnspiel. ADZINE verlost noch einmal 2 Tickets im Wert von á 780,00 €. (Conference & Pioneers). Machen Sie mit und beantworten Sie folgende Frage:

"Die Löschung von Information verbraucht Energie."  Wie nennt man dieses Prinzip, das die Thermodynamik mit der Informationstheorie verbindet und auf die Forschungsarbeit eines deutsch-US-amerikanischen Physikers und Informationswissenschaftlers zurückgeht.

a) Das Limburger Prinzip

b) Das Lindauer Prinzip

c) Das Landauer Prinzip

Senden Sie Ihre Antwort per E-Mail einfach an redaktion@adzine.de, Betreff: "Drittes Data Days Gewinnspiel"  Teilnahmeschluss ist Donnerstag der 27.09.2012. (Anmerkung: Wir mussten den Teilnahmeschluss aufgrund der Zeitnähe zum Event auf Donnerstag verkürzen. Wir bitten um Verständnis und bedanken uns für die abermals überwältigende Teilnahme.

Und hier die Auflösung zum Gewinnspiel:

Die richtige Antwort war c)  Das Landauer Prinzip, benannt nach Rolf Wilhelm Landauer.

Je eine Eintrittskarte im Wert von á 780,00 Euro haben gewonnen:
Alexandra Frase und Stefanie Eisenschenk.
Herzlichen Glückwunsch!

Matt Turck Über den Autor/die Autorin:

Matt Turck ist Managing Director und Gründer von Bloomberg Ventures, dem Inkubator- und Investment-Arm von Bloomberg L.P. Davor war er Mitgründer von TripleHop Technologies, einem Software-Unternehmen, das er schließlich an Oracle verkaufte. Matt ist stark involviert in die Start-up-Szene und aktiv als Mentor (Techstarts, Dreamit, ERA, etc.) und Business Angel. Er ist Gründer und Organisator der größten regelmässigen Big Data-Veranstaltung in New York, dem monatlichen "Big Data Meetup". Er twittert als @mattturck und blogt unter http://mattturck.com