Alle Artikel

Meeting-Aufnahmen transkribieren: Der komplette Leitfaden

·14 Min. Lesezeit

Jeden Tag finden weltweit Millionen von Meetings statt — und das meiste, was besprochen wurde, ist innerhalb einer Stunde vergessen. Die Transkription einer Meeting-Aufnahme verwandelt ein Gespräch in ein Dokument: mit Entscheidungen, Aufgaben und Verantwortlichkeiten. Hier erfahren Sie, wie Sie Ihre Meetings aufnehmen, in Text umwandeln und in wenigen Minuten ein Protokoll erstellen.


Warum Meetings transkribieren

Meetings sind das wichtigste Instrument der Entscheidungsfindung im Geschäftsleben. Ohne Aufnahme und Transkription geht jedoch der Großteil der Informationen verloren.

Entscheidungen und Aufgaben dokumentieren

Eine Woche nach einem Call erinnert sich niemand genau daran, was beschlossen wurde. Eine Meeting-Transkription hält jede Entscheidung schriftlich fest — durchsuchbar, zitierbar, teilbar.

Wer hat was gesagt — Verantwortlichkeit

Wenn im Transkript sichtbar ist, wer eine Idee vorgeschlagen oder eine Aufgabe übernommen hat, gibt es weniger Streitigkeiten. Die Sprechererkennung (Diarisierung) macht dies automatisch.

Für diejenigen, die das Meeting verpasst haben

Statt einer Nacherzählung aus zweiter Hand erhält der Kollege den vollständigen Text mit einer KI-Zusammenfassung der wichtigsten Punkte. Das spart allen Beteiligten Zeit.

Team-Wissensdatenbank

Transkribierte Meetings werden zu einer durchsuchbaren Datenbank von Entscheidungen. Sechs Monate später kann man nachschlagen, warum ein bestimmter Ansatz gewählt wurde — ohne die Diskussion zu wiederholen.

Rechtliche Dokumentation

Bei Verhandlungen mit Partnern, Kunden oder Auftragnehmern dient ein Texttranskript als Nachweis von Vereinbarungen. Besonders wichtig, wenn kein unterschriebener Vertrag vorliegt.


So nehmen Sie Meetings auf

Bevor Sie transkribieren können, brauchen Sie eine Aufnahme. So geht es auf verschiedenen Plattformen.

Online-Meetings

Zoom — das beliebteste Videokonferenz-Tool. Die Aufnahme ist auf zwei Arten verfügbar:

Google Meet — Aufnahme ist für Google Workspace-Nutzer verfügbar (Business Standard und höher):

Microsoft Teams — Aufnahme ist in kostenpflichtigen Tarifen verfügbar:

Webex — Aufnahme ist in den meisten Tarifen verfügbar:

Vor-Ort-Meetings

Für persönliche Besprechungen müssen Sie die Aufnahme selbst organisieren:

Smartphone-Diktiergerät — die zugänglichste Option. Nutzen Sie die integrierte Sprachmemos-App (iOS) oder Diktiergerät-App (Android). Legen Sie das Telefon mit dem Display nach unten in die Tischmitte.

USB-Konferenzmikrofon — für regelmäßige Meetings lohnt sich ein spezialisiertes Mikrofon:

Tisch-Konferenzmikrofon — für Besprechungsräume. Einige Modelle (Jabra PanaCast, Poly Studio) kombinieren Mikrofon und Kamera.

Tipp: Für eine bessere Diarisierung (Sprechererkennung) verwenden Sie ein Mikrofon mit guter Stimmerfassung. Je sauberer das Audio, desto genauer die Sprechererkennung.


Schritt-für-Schritt: Von der Aufnahme zum Protokoll

Schritt 1: Die Aufnahmedatei beschaffen

Aus Zoom:

  1. Öffnen Sie Zoom → Meetings → Aufgezeichnet.
  2. Bei lokaler Aufnahme: Finden Sie den Ordner auf Ihrem Computer (normalerweise Dokumente/Zoom).
  3. Bei Cloud-Aufnahme: Laden Sie die Datei aus der Zoom-Cloud herunter.
  4. Sie benötigen die .mp4- oder .m4a-Datei.

Aus Google Meet:

  1. Öffnen Sie Google Drive.
  2. Finden Sie den Ordner „Meet-Aufnahmen".
  3. Laden Sie die .mp4-Datei herunter.

Aus Microsoft Teams:

  1. Öffnen Sie den Meeting-Chat oder OneDrive → Aufnahmen.
  2. Laden Sie die .mp4-Datei herunter.

Unterstützte Formate: MP4, M4A, MP3, WAV, OGG, WEBM, FLAC — praktisch jede Audio- oder Videodatei funktioniert.

Schritt 2: Transkription

Laden Sie die Aufnahmedatei in einen Transkriptionsdienst hoch. So funktioniert es mit Diktovka:

  1. Upload — Datei per Drag-and-Drop auf die Seite ziehen oder einen Link zur Aufnahme einfügen.
  2. Automatische Diarisierung — das System erkennt, wie viele Personen gesprochen haben, und teilt den Text nach Sprechern auf. Sie sehen Zeilen wie „Sprecher 1: ...", „Sprecher 2: ...".
  3. KI-Zusammenfassung — künstliche Intelligenz extrahiert Schlüsselthemen, Entscheidungen und Aufgaben aus dem gesamten Gespräch. Statt ein einstündiges Transkript zu lesen, erhalten Sie eine Zusammenfassung auf einem Bildschirm.

Bearbeitungszeit: abhängig von der Aufnahmelänge. Ein 30-minütiger Call wird in 2-5 Minuten verarbeitet.

Schritt 3: Protokoll erstellen

Erstellen Sie auf Basis der Transkription und KI-Zusammenfassung ein strukturiertes Protokoll:

Protokollstruktur:

Wie KI hilft: Die Zusammenfassung extrahiert automatisch Entscheidungen und Aufgaben aus dem Gesprächsfluss. Sie müssen nur noch strukturieren und ergänzen.

Verteilung: Senden Sie das Protokoll innerhalb von 24 Stunden nach dem Meeting an alle Teilnehmer. Je schneller, desto weniger Erinnerungsabweichungen.


Diarisierung: Wer hat was gesagt

Was ist das

Diarisierung ist die automatische Identifikation, welcher Audioabschnitt zu welchem Sprecher gehört. Das Ergebnis ist nicht nur Text — es ist ein Dialog mit Beschriftungen.

Wie es funktioniert

Das System analysiert die stimmlichen Merkmale jedes Sprechers — Klangfarbe, Tonhöhe, Sprechgeschwindigkeit. Für jede Stimme wird eine numerische Darstellung (Embedding) erstellt — eine Art „Stimmabdruck". Segmente mit ähnlichen Abdrücken werden als zum selben Sprecher gehörend gruppiert.

Sprecherprofile

Wenn dieselben Personen regelmäßig an Ihren Meetings teilnehmen, können Sie Stimmprofile erstellen. Das System fügt dann automatisch Namen statt „Sprecher 1", „Sprecher 2" ein. Diktovka unterstützt Stimmprofile — identifizieren Sie einen Teilnehmer einmal, und er wird in zukünftigen Aufnahmen automatisch erkannt.


Vergleich von Meeting-Transkriptionstools

ToolDiarisierungDeutschKI-ZusammenfassungPreis
Zoom AI CompanionJaJaJaIn Bezahltarifen enthalten
Otter.aiJaNeinJaAb $16,99/Monat
Fireflies.aiJaJaJaAb $18/Monat
tl;dvJaJaJaAb $18/Monat
DiktovkaJaJa (nativ)JaKostenlos / Pro

Detaillierter Vergleich

Zoom AI Companion — in Zoom integriert, funktioniert nur mit Zoom-Aufnahmen. Praktisch, wenn die gesamte Kommunikation über Zoom läuft. Deutsche Spracherkennung verfügbar, aber nicht so stark wie Englisch.

Otter.ai — Marktführer, aber auf Englisch ausgerichtet. Kein Deutsch. Hervorragende Zoom- und Google-Meet-Integration.

Fireflies.ai — verbindet sich automatisch mit Calls und nimmt auf. Gute CRM-Integration. Deutsche Unterstützung vorhanden, Qualität schwankend.

tl;dv — Fokus auf das Hervorheben wichtiger Meeting-Momente. Gute Kalenderintegration. Wachsende Sprachunterstützung inklusive Deutsch.

Diktovka — native Unterstützung für 99 Sprachen inklusive exzellentes Deutsch auf Basis von Whisper. Diarisierung, KI-Zusammenfassungen, Sprecher-Stimmprofile. Funktioniert mit jeder Audiodatei, nicht an eine bestimmte Konferenzplattform gebunden.


Best Practices für Meeting-Transkription

Zeichnen Sie jedes Meeting auf

Machen Sie die Aufnahme zur Regel, nicht zur Ausnahme. Kündigen Sie zu Beginn an: „Dieses Meeting wird für das Protokoll aufgezeichnet." Das schafft Disziplin und hilft allen, fokussiert zu bleiben.

Verwenden Sie eine Protokollvorlage

Eine Standardvorlage beschleunigt die Erstellung und sorgt für Einheitlichkeit. Richten Sie eine Vorlage in Notion, Google Docs oder Ihrem Projektmanagement-Tool ein.

Sofort verarbeiten, nicht aufstauen

Transkribieren Sie Aufnahmen am selben Tag. Nach einer Woche verblasst der Kontext, und die Überprüfung des Transkripts dauert dreimal so lang.

Aufgaben aus dem Ergebnis ableiten

Ein Protokoll ohne Aufgaben ist nutzloses Papier. Jede Entscheidung sollte zu einer Aufgabe mit Verantwortlichem und Deadline werden. Übertragen Sie Aufgaben vom Protokoll in Ihren Task-Tracker (Jira, Asana, Trello, Monday.com).

Transkripte zentral speichern

Erstellen Sie ein zentralisiertes Archiv für alle Protokolle — einen Google-Drive-Ordner, einen Confluence-Bereich oder eine Notion-Datenbank. Dies wird zum durchsuchbaren Entscheidungsarchiv Ihres Teams.


Rechtliche Aspekte der Meeting-Aufnahme

Einwilligung der Teilnehmer

In Deutschland und Österreich ist die Aufnahme von Gesprächen ohne Einwilligung aller Beteiligten nach § 201 StGB strafbar. In der Schweiz gelten ähnliche Regelungen nach Art. 179bis StGB.

Best Practice: Fügen Sie in die Meeting-Einladung ein: „Dieses Meeting wird für die Protokollerstellung aufgezeichnet. Die Teilnahme gilt als Einwilligung zur Aufnahme."

DSGVO (Datenschutz-Grundverordnung)

Sprachaufnahmen sind personenbezogene Daten nach der DSGVO:

Betriebsvereinbarung

In Unternehmen mit Betriebsrat kann die Aufnahme von Meetings einer Betriebsvereinbarung unterliegen. Klären Sie vorab mit der Rechtsabteilung und dem Betriebsrat.

Vertraulichkeit


Fazit

Meeting-Transkription ist keine Bürokratie — es ist ein Effizienz-Tool. Die Umwandlung einer Meeting-Aufnahme in Text dauert Minuten, spart aber Stunden an Nacherzählungen, Streitigkeiten und verlorenen Entscheidungen.

Der Prozess ist einfach: Meeting aufnehmen → in Diktovka hochladen → Text mit Diarisierung und KI-Zusammenfassung erhalten → Protokoll erstellen → Aufgaben verteilen. Fünf Schritte — und keine Entscheidung geht verloren.

FAQ

Wie nehme ich einen Zoom-Call für die Transkription auf?

Zoom bietet lokale Aufnahme (kostenlos, Datei wird als MP4/M4A auf dem Computer gespeichert) und Cloud-Aufnahme (kostenpflichtige Pro-Tarife und höher). Dateien finden Sie unter Zoom → Meetings → Aufgezeichnet. Tipp: Aktivieren Sie in den Einstellungen «Separate Audiodatei für jeden Teilnehmer aufnehmen» für bessere Diarisierung.

Wie funktioniert die Sprechererkennung bei Meeting-Aufnahmen?

Das System analysiert die stimmlichen Merkmale jedes Sprechers — Klangfarbe, Tonhöhe, Sprechgeschwindigkeit — und erstellt eine numerische Darstellung (Embedding) für jede Stimme. Segmente mit ähnlichen Stimmabdrücken werden demselben Sprecher zugeordnet. Über Stimmprofile kann das System automatisch Namen einsetzen.

Welcher Dienst eignet sich am besten für die Meeting-Transkription?

Für mehrsprachige Unterstützung sind Diktovka (Whisper-basiert, Diarisierung + KI-Zusammenfassung) und Fireflies.ai (60+ Sprachen, CRM-Integration) starke Optionen. Otter.ai ist führend bei reinen Englisch-Meetings. Zoom AI Companion eignet sich gut, wenn das gesamte Team Zoom nutzt.

Kann ich ein Meeting in Echtzeit transkribieren?

Ja. Google Meet unterstützt Live-Untertitel in vielen Sprachen, Microsoft Teams bietet Live-Untertitel in über 60 Sprachen. Drittanbieter wie Fireflies.ai und tl;dv können an Calls teilnehmen und in Echtzeit transkribieren.

Brauche ich die Einwilligung der Teilnehmer für die Meeting-Aufnahme?

Ja. In Deutschland und Österreich ist die Aufnahme ohne Einwilligung aller Beteiligten nach § 201 StGB strafbar. Am besten fügen Sie einen Hinweis zur Aufnahme in die Meeting-Einladung ein und kündigen sie zu Beginn mündlich an.