Spaactor ist eine Suchmaschine für Audio- und Vidodateien. Mit Hilfe von Spracherkennungssoftware werden nicht nur geschriebene, sondern auch gesprochene Inhalte gefunden. Crawler durchsuchen täglich die wichtigsten audiovisuellen Online-Quellen in deutscher Sprache. Zuerst wird die Tonspur extrahiert, dann das Gesprochene in Text umgewandelt und schliesslich im Transkript gesucht. In den Resultaten werden die gefundenen Begriffe farblich hervorgehoben. Zeitstempel (mm:ss) verweisen auf das Transkript.
Der Dienst zeigt nicht nur die gefundenen Medien an, sondern liefert auch die sekundengenaue Position des gesuchten Begriffs.
Man kann die Datei herunterladen oder die genauen Fundstellen über Social-Media-Buttons schnell und einfach teilen und weiterleiten. Der Dienst ist kostenlos. Falls man eine Quelle vermisst, kann man diese über „neue Sender aufnehmen“ melden.
Durchsucht werden deutsche Inhalte im Fernsehen, im Radio, auf Youtube-Kanälen oder Vimeo, in Mediatheken, auch in Podcasts auf Spotify oder iTunes. Die Datenbank bietet momentan über 1,5 Millionen frei durchsuchbare Video- und Audiodokumente an. Das Wörterbuch enthält 150’000 Wörter.
Das Start-up von Thorsten Schoop und Christian Schrumpf wurde in diesem Sommer beim Wettbewerb „Land der Ideen“ ausgezeichnet.
Spaactor: Suche und erweiterte Suche
Suchabfragen
Nach einer Suchabfrage wird ein Vorschaubild angezeigt und ein Teil des Transkripts in der Umgebung der Fundstelle. Die Suchbegriffe sind blau hervorgehoben. Wenn man sie anklickt, kommt man genau zu der Stelle im Video.
Bei der erweiterten Suche kann man filtern nach den Sendern bzw. Kanälen, dem Zeitraum und nach dem Vorkommen des Inhalts (in allen verfügbaren Inhalten, im Video/Audio (Transkript), im Titel, im Inhalt (Meta-Daten), in der Link-Adresse).
Im kostenpflichtigen Modus ist es registrierten Nutzern auch möglich, Suchaufträge einzurichten, Medien zu beobachten und mit einer Exportfunktion die gefundenen Informationen herunterzuladen. Angeboten werden zudem Schnittstellen (APIs) für die Verarbeitung grosser Datenbestände. Unter „Aktuelle Top Themen“ sieht man, was aktuell gerae passiert.
Das Geld verdient der Dienst mit Werbebannern und institutionellen Kunden wie „PR-Agenturen, Sendeanstalten, Museen oder Stiftungen“. Die Günter-Grass Stiftung habe beispielsweise ihr audiovisuelles Archiv über Spaactor erschlossen. (Welt: Audiodateien auf der Spur)
Bald sollen auch Inhalte in Englisch angeboten werden.
Beispiele
- Die Suche nach Personen wie etwa „Paul Rechsteiner“ führt zum letzten Beitrag der Mediathek SRF oder zu Podcasts wie Newssendungen des Radio SRF.
- „Roman Signer“ führt bei den ersten Resultaten zum ARD Bericht über seine neue Ausstellung „Explosive Kunst in Hannover“ (28.08.18)
- Die Suche nach einem Schlüsselwort wie „Blutvergiftung“ führt zum letzten Beitrag von 10vor10, zu den Mediatheken von HR, NDR oder SWR.
Spaactor füllt eine spannende Lücke, die Google noch nicht abdeckt.
Der Dienst kann dazu genutzt werden, ein aktuelles Thema zu verfolgen, schnell eine bestimmte Stelle in einem Film zu finden, nach einem Filmausschnitt zu einem aktuellen Thema zu suchen und auch, um zu sehen, was gerade passiert und über Video und Audio veröffentlicht wird.
Links
- Digithek Blog: Suchmaschine für gesprochenes Wort in Video- und Audiodateien (04.01.17).
- Gründerszene: Diese Gründer wollen Google angreifen – mit Spracherkennung (23.05.18).
- Spiegel online: Bremer Projekt (13.08.18).
- Welt: «Land der Ideen»: 100 Start-ups ausgezeichnet (04.06.18) und Audiodateien auf der Spur (23.05.18).
0 Kommentare