CTV ist noch „Wilder Westen“
Anton Priebe, 3. Februar 2026Interview mit Elisa Schwuchow, Scene Context
Connected TV ist ein Wachstumsmarkt, doch insbesondere im programmatischen Einkauf fehlt es oft an Informationen über die konkreten Inhalte. So bleibt der Content, in denen die Werbung platziert wird, für die Demand-Side-Plattformen oft ein Ratespiel, mit entsprechenden Folgen für Effizienz und Planungssicherheit. Kontextuelles Targeting soll diese Lücke schließen, stieß im CTV-Umfeld aber bislang an seine Grenzen. Elisa Schwuchow, Mitgründerin des Hamburger Contextual-Spezialisten Scene Context, erklärt im Interview, wie es besser geht und welche Rolle semantische Analysen künftig für Relevanz und Wirkung von Bewegtbild spielen könnten.
ADZINE: Hallo Elisa, womit beschäftigt ihr euch bei Scene Context?
Elisa Schwuchow: Wir helfen werbetreibenden Unternehmen dabei, ihre Video-Werbung im passenden Umfeld zu platzieren. Dafür haben wir eine KI entwickelt, die Video-Inhalte ähnlich versteht wie ein Mensch. Auf dieser Basis haben wir unsere Contextual-Intelligence-Plattform gebaut. Werbetreibende und Agenturen können damit Video-, Streaming- und CTV-Werbung präzise in relevanten Umfeldern ausspielen.
Ein Beispiel: Wenn Rügenwalder eine vegane Wurst bewirbt, stellen wir sicher, dass der Spot in Videokontexten erscheint, die sich mit pflanzenbasierter Ernährung, Tierwohl oder Nachhaltigkeit beschäftigen, also in thematisch passenden Inhalten.
ADZINE: Damit das funktioniert, müsst ihr technisch an die Platzierungen angebunden sein. Wie sieht das aus?
Schwuchow: Wir sind über Pubmatic und Equativ angebunden und dort als Datenpartner integriert. Diese SSPs ermöglichen Sell-Side-Curation, also das kontextuelle Vor-Targeting. Darüber können wir unsere Daten marktweit verfügbar machen und Deal-IDs bereitstellen. Zusätzlich haben wir eine eigene DSP-Infrastruktur, über die man auch direkt I/O-Business einbuchen kann.
ADZINE: Wenn ihr bei einer SSP integriert seid und ein Advertiser beispielsweise seinen Deal dort aufsetzt – dann müsst ihr den Content des Publishers vorher analysiert haben. Funktioniert die Echtzeit-Analyse in CTV überhaupt?
Schwuchow: Es hängt vom Segment ab. Im Streaming-Bereich – also CTV – unterscheiden wir zwischen On-Demand- und linearen Inhalten. Für beide Bereiche haben wir eine umfangreiche vorbereitete Datenbank mit aktuell über neun Millionen Film- und Sendungsinhalten aus den letzten 30 Jahren, ergänzt um laufend neue Titel.
Wenn ein Bid-Request kommt, gleichen wir den Inhalt mit unserer Datenbank ab und können das Video genau einordnen. Und das ist der wesentliche Unterschied zu fast allen anderen Contextual-Anbietern: Die meisten sind komplett abhängig von Daten, die der Publisher im Bidstream liefert. Aber nur 5 bis 7 Prozent aller Bid-Requests enthalten überhaupt Content-Daten. In über 90 Prozent weiß man also weder Genre noch Titel oder Channel. Wir dagegen reichern die fehlenden Content-Informationen selbst an.
Im Online-Video-Bereich ist es anders. Dort entstehen täglich tausende neue Videos, die wir nicht vorab analysieren können. Deshalb klassifizieren wir neue Videos in Echtzeit. Beim ersten Bid-Request starten wir die Analyse, beim zweiten liegt die vollständige Klassifizierung vor.
ADZINE: Können Werbetreibende über euch kontextuell bei großen Plattformen wie Amazon Prime Video oder Netflix targeten?
Schwuchow: An der Stelle müssen wir zwischen Targeting und Reporting unterscheiden. Reporting funktioniert plattformübergreifend für jede CTV-Kampagne, unabhängig vom Anbieter.
Targeting funktioniert grundsätzlich ebenfalls plattformübergreifend, hängt aber von der jeweiligen technischen Integration ab. Aktuell sind wir über Sell-Side-Partner integriert. Wir arbeiten parallel an Demand-Side-Integrationen.
ADZINE: Wie reif ist der Markt für Contextual Targeting im CTV? Viele Player bieten Lösungen an, aber so richtig Fahrt aufnehmen wollen die nicht?
Schwuchow: Es gibt Bewegung, aber der Markt hat strukturelle Probleme. Kontextuelles Targeting ist technisch schwierig, weil in Programmatic-CTV schlicht kaum Content-Daten verfügbar sind. Ansätze wie ACR, Automated Content Recognition, funktionieren nur innerhalb einzelner Plattformen und sind nicht plattformübergreifend skalierbar.
Wenn wie heute im Programmatic in 93 bis 95 Prozent der Fälle keine Content-Informationen verfügbar sind, ist der Werbetreibende entweder auf wenige Publisher angewiesen oder es werden fragmentierte Daten aus Einzelquellen gesammelt.
ADZINE: Warum fehlen die Daten im Bidstream?
Schwuchow: Es gibt mehrere Gründe. Manche Publisher übermitteln keine Content-Daten, manche SSPs speichern die Felder nicht, manche DSPs lesen sie nicht aus.
Die Felder sind außerdem nicht standardisiert. Es existieren unterschiedliche Sprachen, Schreibweisen, Abkürzungen, inkonsistente Formatierungen. Das führt dazu, dass der Großteil der Informationen entweder gar nicht ankommt oder nicht verwertbar ist. Große Teile unserer Arbeit bestehen in der Harmonisierung.
ADZINE: Was machen Marken, die wissen wollen, in welchen Umfeldern sie laufen?
Schwuchow: Viele Advertiser wünschen sich mehr Transparenz – etwa in Form einer Senderliste für ihre Programmatic-CTV-Kampagnen. In der Praxis ist das für DSPs und Agenturen aber oft schwer umzusetzen. Im Markt weiß jeder, dass es an Transparenz mangelt, aber man hofft, dass es schon irgendwie funktioniert.
Da inzwischen mehr Budget in den CTV-Markt fließt, wächst auch der Druck auf Transparenz. Heute werden schätzungsweise 30 bis 50 Prozent der Budgets in Umfeldern ausgespielt, die für die Marken irrelevant sind.
ADZINE: Welche Rolle spielt die semantische Analyse bei der Bewertung von CTV-Umfeldern?
Schwuchow: Eine große. Objekterkennung ist einfach, aber Verständnis entsteht erst durch Semantik – Stimmung, Handlung, Beziehungen zwischen Personen. Die KI versteht einen Film wie ein Mensch. Wir analysieren auch die Stimmung eines Werbespots und matchen mit passenden Content-Situationen.
Spots für Hilfsorganisationen beispielsweise funktionieren besser in traurigen Szenen und nicht mitten in einer Komödie. Oder ein Schokoladen-Spot performt besser in emotionalen, sehnsuchtsvollen Momenten. Durch semantisches Matching steigert man die Relevanz erheblich.
ADZINE: Wie beeinflussen Datenschutz- und die Entwicklungen rund um KI den Einkauf im CTV?
Schwuchow: CTV ist teilweise noch „Wilder Westen“. Die Consent-Erfassung ist zum Beispiel nicht immer optimal. Contextual benötigt keine personenbezogenen Daten und arbeitet rein Content-basiert. Das ist im CTV besonders sinnvoll, weil Co-Viewing-Rates je nach Hersteller bei 80 bis 90 Prozent liegen. Personenbezogenes Targeting ergibt deshalb weniger Sinn als etwa im Mobile-Bereich.
Viele CTV-Käufe basieren bislang auf Postleitzahlen, IP-Adressen oder DMP-Daten. Im klassischen TV war Umfeldbuchungen immer normal – wir bringen das ins Programmatic zurück. Kontextuelles Targeting wird damit ein zentraler Wachstumsbereich.
ADZINE: Woran arbeitet ihr derzeit, um den Contextual-Markt weiter voranzubringen?
Schwuchow: An zwei großen Bereichen. Zunächst an Dynamic Optimization. Wir kombinieren Relevance-Scores mit Werbewirkungsdaten wie Website-Visits oder Sales. Ziel ist, automatisch mehr Inventar in Umfeldern zu kaufen, die eine nachweislich bessere Wirkung haben. Damit wird CTV teilweise zu einem Outcome- beziehungsweise Performance-Channel.
Zweitens die Scene-Level-Analyse. Wir können jede einzelne Szene analysieren. In den USA arbeiten Publisher schon damit und platzieren Spots unmittelbar nach passenden Momenten. Zum Beispiel verschüttet in einer Szene jemand Kaffee auf sein Hemd – danach erscheint ein L-Shape-Ad für ein Reinigungsmittel. Dafür müssen Publisher in Deutschland ihre Systeme stärker öffnen. Hier ist der Markt aber noch fragmentierter.
ADZINE: Danke für das Interview, Elisa.
Tech Finder Unternehmen im Artikel
EVENT-TIPP ADZINE Live - SPOTLIGHT: Geodata Innovation am 12. Februar 2026, 11:30 Uhr - 12:30 Uhr
In dieser SPOTLIGHT-Folge nehmen wir Innovationen rund um Data und Targeting unter die Lupe. Jetzt anmelden!