Meeting-Aufnahmen transkribieren: Der komplette Leitfaden
Jeden Tag finden weltweit Millionen von Meetings statt — und das meiste, was besprochen wurde, ist innerhalb einer Stunde vergessen. Die Transkription einer Meeting-Aufnahme verwandelt ein Gespräch in ein Dokument: mit Entscheidungen, Aufgaben und Verantwortlichkeiten. Hier erfahren Sie, wie Sie Ihre Meetings aufnehmen, in Text umwandeln und in wenigen Minuten ein Protokoll erstellen.
Warum Meetings transkribieren
Meetings sind das wichtigste Instrument der Entscheidungsfindung im Geschäftsleben. Ohne Aufnahme und Transkription geht jedoch der Großteil der Informationen verloren.
Entscheidungen und Aufgaben dokumentieren
Eine Woche nach einem Call erinnert sich niemand genau daran, was beschlossen wurde. Eine Meeting-Transkription hält jede Entscheidung schriftlich fest — durchsuchbar, zitierbar, teilbar.
Wer hat was gesagt — Verantwortlichkeit
Wenn im Transkript sichtbar ist, wer eine Idee vorgeschlagen oder eine Aufgabe übernommen hat, gibt es weniger Streitigkeiten. Die Sprechererkennung (Diarisierung) macht dies automatisch.
Für diejenigen, die das Meeting verpasst haben
Statt einer Nacherzählung aus zweiter Hand erhält der Kollege den vollständigen Text mit einer KI-Zusammenfassung der wichtigsten Punkte. Das spart allen Beteiligten Zeit.
Team-Wissensdatenbank
Transkribierte Meetings werden zu einer durchsuchbaren Datenbank von Entscheidungen. Sechs Monate später kann man nachschlagen, warum ein bestimmter Ansatz gewählt wurde — ohne die Diskussion zu wiederholen.
Rechtliche Dokumentation
Bei Verhandlungen mit Partnern, Kunden oder Auftragnehmern dient ein Texttranskript als Nachweis von Vereinbarungen. Besonders wichtig, wenn kein unterschriebener Vertrag vorliegt.
So nehmen Sie Meetings auf
Bevor Sie transkribieren können, brauchen Sie eine Aufnahme. So geht es auf verschiedenen Plattformen.
Online-Meetings
Zoom — das beliebteste Videokonferenz-Tool. Die Aufnahme ist auf zwei Arten verfügbar:
- Lokale Aufnahme — wird auf dem Computer des Organisators als MP4 (Video) oder M4A (nur Audio) gespeichert. Verfügbar im kostenlosen Tarif.
- Cloud-Aufnahme — verfügbar in kostenpflichtigen Tarifen (Pro und höher). Dateien werden in der Zoom-Cloud gespeichert und können heruntergeladen werden.
- Wo zu finden: Zoom → Meetings → Aufgezeichnet → Lokal/Cloud.
Google Meet — Aufnahme ist für Google Workspace-Nutzer verfügbar (Business Standard und höher):
- Aufnahmen werden auf dem Google Drive des Organisators gespeichert.
- Format: MP4.
- Wo zu finden: Google Drive → Meet-Aufnahmen.
Microsoft Teams — Aufnahme ist in kostenpflichtigen Tarifen verfügbar:
- Dateien werden in OneDrive (persönliche Meetings) oder SharePoint (Kanal-Meetings) gespeichert.
- Format: MP4.
- Wo zu finden: OneDrive → Aufnahmen oder im Meeting-Chat.
Webex — Aufnahme ist in den meisten Tarifen verfügbar:
- Dateien können lokal oder in der Webex-Cloud gespeichert werden.
- Wo zu finden: Webex → Aufnahmen.
Vor-Ort-Meetings
Für persönliche Besprechungen müssen Sie die Aufnahme selbst organisieren:
Smartphone-Diktiergerät — die zugänglichste Option. Nutzen Sie die integrierte Sprachmemos-App (iOS) oder Diktiergerät-App (Android). Legen Sie das Telefon mit dem Display nach unten in die Tischmitte.
USB-Konferenzmikrofon — für regelmäßige Meetings lohnt sich ein spezialisiertes Mikrofon:
- Jabra Speak Serie — ab ca. 100 €, qualitativ hochwertiger Sound bis 2,5 m Reichweite.
- Poly Sync Serie — Geräuschunterdrückung, ideal für Großraumbüros.
- Anker PowerConf — preisgünstige Option mit guter Qualität.
Tisch-Konferenzmikrofon — für Besprechungsräume. Einige Modelle (Jabra PanaCast, Poly Studio) kombinieren Mikrofon und Kamera.
Tipp: Für eine bessere Diarisierung (Sprechererkennung) verwenden Sie ein Mikrofon mit guter Stimmerfassung. Je sauberer das Audio, desto genauer die Sprechererkennung.
Schritt-für-Schritt: Von der Aufnahme zum Protokoll
Schritt 1: Die Aufnahmedatei beschaffen
Aus Zoom:
- Öffnen Sie Zoom → Meetings → Aufgezeichnet.
- Bei lokaler Aufnahme: Finden Sie den Ordner auf Ihrem Computer (normalerweise Dokumente/Zoom).
- Bei Cloud-Aufnahme: Laden Sie die Datei aus der Zoom-Cloud herunter.
- Sie benötigen die .mp4- oder .m4a-Datei.
Aus Google Meet:
- Öffnen Sie Google Drive.
- Finden Sie den Ordner „Meet-Aufnahmen".
- Laden Sie die .mp4-Datei herunter.
Aus Microsoft Teams:
- Öffnen Sie den Meeting-Chat oder OneDrive → Aufnahmen.
- Laden Sie die .mp4-Datei herunter.
Unterstützte Formate: MP4, M4A, MP3, WAV, OGG, WEBM, FLAC — praktisch jede Audio- oder Videodatei funktioniert.
Schritt 2: Transkription
Laden Sie die Aufnahmedatei in einen Transkriptionsdienst hoch. So funktioniert es mit Diktovka:
- Upload — Datei per Drag-and-Drop auf die Seite ziehen oder einen Link zur Aufnahme einfügen.
- Automatische Diarisierung — das System erkennt, wie viele Personen gesprochen haben, und teilt den Text nach Sprechern auf. Sie sehen Zeilen wie „Sprecher 1: ...", „Sprecher 2: ...".
- KI-Zusammenfassung — künstliche Intelligenz extrahiert Schlüsselthemen, Entscheidungen und Aufgaben aus dem gesamten Gespräch. Statt ein einstündiges Transkript zu lesen, erhalten Sie eine Zusammenfassung auf einem Bildschirm.
Bearbeitungszeit: abhängig von der Aufnahmelänge. Ein 30-minütiger Call wird in 2-5 Minuten verarbeitet.
Schritt 3: Protokoll erstellen
Erstellen Sie auf Basis der Transkription und KI-Zusammenfassung ein strukturiertes Protokoll:
Protokollstruktur:
- Datum und Uhrzeit — wann das Meeting stattfand
- Teilnehmer — Liste der Anwesenden (aus der Diarisierung)
- Tagesordnung — besprochene Themen
- Diskussion — Kernpunkte zu jedem Thema
- Entscheidungen — was beschlossen wurde
- Aufgaben — wer macht was bis wann
- Nächstes Meeting — Datum und Tagesordnung
Wie KI hilft: Die Zusammenfassung extrahiert automatisch Entscheidungen und Aufgaben aus dem Gesprächsfluss. Sie müssen nur noch strukturieren und ergänzen.
Verteilung: Senden Sie das Protokoll innerhalb von 24 Stunden nach dem Meeting an alle Teilnehmer. Je schneller, desto weniger Erinnerungsabweichungen.
Diarisierung: Wer hat was gesagt
Was ist das
Diarisierung ist die automatische Identifikation, welcher Audioabschnitt zu welchem Sprecher gehört. Das Ergebnis ist nicht nur Text — es ist ein Dialog mit Beschriftungen.
Wie es funktioniert
Das System analysiert die stimmlichen Merkmale jedes Sprechers — Klangfarbe, Tonhöhe, Sprechgeschwindigkeit. Für jede Stimme wird eine numerische Darstellung (Embedding) erstellt — eine Art „Stimmabdruck". Segmente mit ähnlichen Abdrücken werden als zum selben Sprecher gehörend gruppiert.
Sprecherprofile
Wenn dieselben Personen regelmäßig an Ihren Meetings teilnehmen, können Sie Stimmprofile erstellen. Das System fügt dann automatisch Namen statt „Sprecher 1", „Sprecher 2" ein. Diktovka unterstützt Stimmprofile — identifizieren Sie einen Teilnehmer einmal, und er wird in zukünftigen Aufnahmen automatisch erkannt.
Vergleich von Meeting-Transkriptionstools
| Tool | Diarisierung | Deutsch | KI-Zusammenfassung | Preis |
|---|---|---|---|---|
| Zoom AI Companion | Ja | Ja | Ja | In Bezahltarifen enthalten |
| Otter.ai | Ja | Nein | Ja | Ab $16,99/Monat |
| Fireflies.ai | Ja | Ja | Ja | Ab $18/Monat |
| tl;dv | Ja | Ja | Ja | Ab $18/Monat |
| Diktovka | Ja | Ja (nativ) | Ja | Kostenlos / Pro |
Detaillierter Vergleich
Zoom AI Companion — in Zoom integriert, funktioniert nur mit Zoom-Aufnahmen. Praktisch, wenn die gesamte Kommunikation über Zoom läuft. Deutsche Spracherkennung verfügbar, aber nicht so stark wie Englisch.
Otter.ai — Marktführer, aber auf Englisch ausgerichtet. Kein Deutsch. Hervorragende Zoom- und Google-Meet-Integration.
Fireflies.ai — verbindet sich automatisch mit Calls und nimmt auf. Gute CRM-Integration. Deutsche Unterstützung vorhanden, Qualität schwankend.
tl;dv — Fokus auf das Hervorheben wichtiger Meeting-Momente. Gute Kalenderintegration. Wachsende Sprachunterstützung inklusive Deutsch.
Diktovka — native Unterstützung für 99 Sprachen inklusive exzellentes Deutsch auf Basis von Whisper. Diarisierung, KI-Zusammenfassungen, Sprecher-Stimmprofile. Funktioniert mit jeder Audiodatei, nicht an eine bestimmte Konferenzplattform gebunden.
Best Practices für Meeting-Transkription
Zeichnen Sie jedes Meeting auf
Machen Sie die Aufnahme zur Regel, nicht zur Ausnahme. Kündigen Sie zu Beginn an: „Dieses Meeting wird für das Protokoll aufgezeichnet." Das schafft Disziplin und hilft allen, fokussiert zu bleiben.
Verwenden Sie eine Protokollvorlage
Eine Standardvorlage beschleunigt die Erstellung und sorgt für Einheitlichkeit. Richten Sie eine Vorlage in Notion, Google Docs oder Ihrem Projektmanagement-Tool ein.
Sofort verarbeiten, nicht aufstauen
Transkribieren Sie Aufnahmen am selben Tag. Nach einer Woche verblasst der Kontext, und die Überprüfung des Transkripts dauert dreimal so lang.
Aufgaben aus dem Ergebnis ableiten
Ein Protokoll ohne Aufgaben ist nutzloses Papier. Jede Entscheidung sollte zu einer Aufgabe mit Verantwortlichem und Deadline werden. Übertragen Sie Aufgaben vom Protokoll in Ihren Task-Tracker (Jira, Asana, Trello, Monday.com).
Transkripte zentral speichern
Erstellen Sie ein zentralisiertes Archiv für alle Protokolle — einen Google-Drive-Ordner, einen Confluence-Bereich oder eine Notion-Datenbank. Dies wird zum durchsuchbaren Entscheidungsarchiv Ihres Teams.
Rechtliche Aspekte der Meeting-Aufnahme
Einwilligung der Teilnehmer
In Deutschland und Österreich ist die Aufnahme von Gesprächen ohne Einwilligung aller Beteiligten nach § 201 StGB strafbar. In der Schweiz gelten ähnliche Regelungen nach Art. 179bis StGB.
Best Practice: Fügen Sie in die Meeting-Einladung ein: „Dieses Meeting wird für die Protokollerstellung aufgezeichnet. Die Teilnahme gilt als Einwilligung zur Aufnahme."
DSGVO (Datenschutz-Grundverordnung)
Sprachaufnahmen sind personenbezogene Daten nach der DSGVO:
- Die Verarbeitung erfordert eine Rechtsgrundlage (Einwilligung oder berechtigtes Interesse).
- Betroffene haben das Recht auf Auskunft, Berichtigung und Löschung.
- Mit dem Transkriptionsanbieter ist ggf. ein Auftragsverarbeitungsvertrag (AVV) erforderlich.
- Aufbewahrungsfristen müssen definiert und dokumentiert werden.
- Daten sollten möglichst innerhalb des EWR verarbeitet werden.
Betriebsvereinbarung
In Unternehmen mit Betriebsrat kann die Aufnahme von Meetings einer Betriebsvereinbarung unterliegen. Klären Sie vorab mit der Rechtsabteilung und dem Betriebsrat.
Vertraulichkeit
- Transkribieren Sie Aufnahmen mit Geschäftsgeheimnissen nicht über öffentliche Cloud-Dienste ohne NDA.
- Stellen Sie sicher, dass Ihr Transkriptionsdienst Ihre Daten nicht für das Training von Modellen verwendet.
- Für besonders sensible Meetings erwägen Sie Self-Hosted-Lösungen.
- Beschränken Sie den Zugriff auf Transkripte — nicht jeder Mitarbeiter muss jedes Protokoll sehen können.
Fazit
Meeting-Transkription ist keine Bürokratie — es ist ein Effizienz-Tool. Die Umwandlung einer Meeting-Aufnahme in Text dauert Minuten, spart aber Stunden an Nacherzählungen, Streitigkeiten und verlorenen Entscheidungen.
Der Prozess ist einfach: Meeting aufnehmen → in Diktovka hochladen → Text mit Diarisierung und KI-Zusammenfassung erhalten → Protokoll erstellen → Aufgaben verteilen. Fünf Schritte — und keine Entscheidung geht verloren.
FAQ
Wie nehme ich einen Zoom-Call für die Transkription auf?
Zoom bietet lokale Aufnahme (kostenlos, Datei wird als MP4/M4A auf dem Computer gespeichert) und Cloud-Aufnahme (kostenpflichtige Pro-Tarife und höher). Dateien finden Sie unter Zoom → Meetings → Aufgezeichnet. Tipp: Aktivieren Sie in den Einstellungen «Separate Audiodatei für jeden Teilnehmer aufnehmen» für bessere Diarisierung.
Wie funktioniert die Sprechererkennung bei Meeting-Aufnahmen?
Das System analysiert die stimmlichen Merkmale jedes Sprechers — Klangfarbe, Tonhöhe, Sprechgeschwindigkeit — und erstellt eine numerische Darstellung (Embedding) für jede Stimme. Segmente mit ähnlichen Stimmabdrücken werden demselben Sprecher zugeordnet. Über Stimmprofile kann das System automatisch Namen einsetzen.
Welcher Dienst eignet sich am besten für die Meeting-Transkription?
Für mehrsprachige Unterstützung sind Diktovka (Whisper-basiert, Diarisierung + KI-Zusammenfassung) und Fireflies.ai (60+ Sprachen, CRM-Integration) starke Optionen. Otter.ai ist führend bei reinen Englisch-Meetings. Zoom AI Companion eignet sich gut, wenn das gesamte Team Zoom nutzt.
Kann ich ein Meeting in Echtzeit transkribieren?
Ja. Google Meet unterstützt Live-Untertitel in vielen Sprachen, Microsoft Teams bietet Live-Untertitel in über 60 Sprachen. Drittanbieter wie Fireflies.ai und tl;dv können an Calls teilnehmen und in Echtzeit transkribieren.
Brauche ich die Einwilligung der Teilnehmer für die Meeting-Aufnahme?
Ja. In Deutschland und Österreich ist die Aufnahme ohne Einwilligung aller Beteiligten nach § 201 StGB strafbar. Am besten fügen Sie einen Hinweis zur Aufnahme in die Meeting-Einladung ein und kündigen sie zu Beginn mündlich an.