noScribe – Interviews mit KI transkribieren#

Dies ist die offizielle Webseite der Open-Source-Software noScribe (GitHub).

Achtung: Jemand versucht über die Domain noscribe(punkt)ai kostenpflichtige Transkriptionsdienste zu verkaufen. Ich habe damit nichts zu tun. Das echte noScribe ist kostenlos und wird es immer bleiben :)

Was ist noScribe?#

  • Kostenlos & frei verfügbar (GPL‑3.0)
  • Keine Cloud, alles bleibt auf dem eigenen Computer
  • Hochwertige Transkripte basierend auf Whisper von OpenAI und Pyannote von Hervé Bredin
  • Sprecher:innenerkennung und Unterstützung von rund 60 Sprachen
  • verfügbar für Windows, macOS und Linux
  • Komfortabler Editor zur Prüfung und Korrektur der Transkripte

Ursprünglich vor allem für die qualitative Sozialforschung entwickelt, wird noScribe heute überall dort eingesetzt, wo wir es mit besonders sensiblen Audiodaten zu tun haben - im Journalismus, in der Medizin, bei Unternehmen, Behörden und NGOs. NoScribe wird von Universitäten und Hochschulen empfohlen, vom Computermagazin c’t, sowie in Fachpublikationen für Journalist:innen.

noScribe Hauptfenster (Der Screenshot zeigt ein Interview mit der exilrussischen Soziologin Natalia Savelyeva, das ich im Mai 2022 geführt habe.)

Wie nutze ich noScribe?#

Ein- und Ausgabe

NoScribe kann fast jedes Audio- oder Videoformat verarbeiten. Als Ausgabe wird standardmäßig eine HTML-Datei erstellt, die direkt in MS Word geöffnet werden kann, mit Zeilennummern und Formatierung. Es kann aber auch reiner Text erzeugt werden oder eine Untertitel-Datei im WebVTT-Format. WebVTT ist vor allem für die Weiterverarbeitung mit EXMARaLDA vorgesehen, einer Spezialsoftware für komplexe Transkriptionssysteme.

Verarbeitung

Da die Transkription komplett lokal auf dem eigenen Computer erfolgt, muss man etwas Zeit einplanen: Eine Stunde Interview braucht ca. 1-3 Stunden Transkriptionszeit, auf älteren Rechnern teils noch länger. Man kann aber mehrere Aufträge in eine Warteschlange stellen, die dann bspw. über Nacht abgearbeitet werden. Eine NVIDIA-Grafikkarte (CUDA) kann die Transkription stark beschleunigen. Da der Download auch die KI-Modelle enthält, ist die Installationsdatei recht groß (ca. 3 GB).

Spezialfunktionen

NoScribe enthält einige Funktionen speziell für die qualitative Sozialforschung: So können Pausen oder gleichzeitiges Sprechen markiert werden und man kann Zeitmarken ([00:01:38]) einfügen lassen. Außerdem kann man entscheiden, ob Füllworte wie “ehm” auch transkribiert werden sollen oder nicht.

Sprachen und Korrektur

Das KI-Modell hinter noScribe kann auch Dialekte wie bspw. Schweizerdeutsch recht gut verarbeiten. Das Gesagte wird dann in die Schriftsprache (“Hochdeutsch”) übertragen. Generell ist es so, dass eine gute Audioaufnahme mit möglichst wenigen Nebengeräuschen viel Zeit bei der Nachbearbeitung des Transkripts spart. Eine Kontrolle und Korrektur ist aber immer nötig. Dazu wird ein eigener Editor mitgeliefert, mit dem man Audio und Text direkt abgleichen kann.

Mehr Info:

Wer steht hinter noScribe?#

Kai Dröge

Dr. Kai Dröge
Soziologe mit Informatik-Hintergrund, Forscher und Dozent

Viele andere Personen haben zu noScribe beigetragen. Mein besonderer Dank gilt Philipp Schneider (gernophil), der seit langem die macOS-Versionen betreut, und Rudolf Siegel (mutlusun), der viele Verbesserungen eingebracht hat.

Spenden#

NoScribe ist kostenlos und wird es auch immer bleiben. Aber die Entwicklung verursacht reale Ausgaben, etwa für diese Webseite, für Testhardware oder eine Apple-Entwicklungslizenz. Wenn Sie das Projekt unterstützen möchten:

ko-fi

Warum der Name „noScribe“?#

Das Urban Dictionary definiert einen Schreiberling oder Scribe als “eine Person, deren erbärmliche Existenz ganz auf akademisches Elend und Schmerz reduziert ist”. Ich hoffe, dass meine Software unser akademisches Leben etwas weniger schmerzhaft und elend machen kann - deshalb “noScribe” :)

Zitierweise (APA Style)#

Dröge, K. (2026). noScribe. AI-powered Audio Transcription (Version XXX) [Computer software]. https://noscribe.de