Transkripsiyon icin Ses Kalitesini Nasil Artirirsiniz: Kapsamli Rehber
Ses kaydi kalitesi, transkripsiyonun dogrulugunu belirleyen en onemli faktordur. OpenAI Whisper dahil en gelismis konusma tanima modelleri bile gurultulu, sessiz veya bozuk kayitlarda onemli olcude daha kotu sonuclar verir. Bu rehberde temiz ses kaydetmek ve dosyalarinizi transkripsiyona hazirlamak icin somut adimlar bulacaksiniz.
Ses Kalitesi Neden Bu Kadar Onemli
Kayit kalitesi ile transkripsiyon dogrulugu arasindaki iliski dogrudan ve olculebilirdir. Sektorde standart metrik WER (Word Error Rate) — yanlis tanilan kelimelerin yuzdesini ifade eder.
Tipik WER degerleri:
- Temiz studyo kaydi: %3-5 hata — neredeyse mukemmel transkripsiyon
- Sessiz ortamda iyi kayit: %5-8 — minimum duzenleme gerekir
- Arka plan gurultusu olan kayit: %15-25 — her 4-6 kelimeden biri hatali
- Kotu kalite kayit (gurultu, yanki, kisik ses): %25-40 — metin ciddi duzenleme gerektirir
%5 ile %25 WER arasindaki fark, "kopyala ve kullan" ile "elle duzeltmeye bir saat harca" arasindaki farktir. Kayit hazirligina 10 dakika yatirim yapmak, saatlerce duzenleme zamani kazandirir.
Temiz Ses Nasil Kaydedilir
Mikrofon Secimi
Dizustu bilgisayarinizin dahili mikrofonu, transkripsiyon icin en kotu secenektir. Odadaki tum sesleri yakalar: klavye tiklama sesleri, fan gurultusu, sokak sesleri. Butcesi uygun bir harici mikrofon bile dramatik olcude daha iyi sonuc verir.
USB mikrofonlar (masa basinda kayit icin):
- Fifine K669 (~250 TL) — butce dostu kondanser USB mikrofon. Fiyatina gore mukemmel kalite, dogrudan bilgisayara baglanir. Baslangic icin ideal.
- Maono AU-903 (~400 TL) — kompakt USB-C mikrofon, gurultu azaltma ozelligi var. Hem dizustu bilgisayarlarla hem de akilli telefonlarla calisir.
- Blue Yeti (~3 000 TL) — USB mikrofonlarin klasigi. Dort kutupsal desen, mukemmel kalite. Butceniz elveriyorsa en iyi secim.
Yaka mikrofonlari (roportajlar ve gorusmeler icin):
- Boya BY-M1 (~200 TL) — kablolu yaka mikrofonu, fiyat/performans orani mukemmel. 3.5 mm jak ile baglanir.
- Boya BY-WM4 (~800 TL) — kablosuz yaka mikrofonu. Hareket ozgurlugu + iyi kalite.
- Yaka mikrofonunu agizdan 15-20 cm mesafeye yaklastirin — bu, arka plan gurultusuz temiz ses saglar.
Toplantilar ve grup kayitlari icin:
- Jabra Speak 510 (~2 500 TL) — cok yonlu mikrofona sahip konferans hoparloru. Masanin her tarafindan sesleri yakalar.
- Anker PowerConf (~1 500 TL) — 6 dahili mikrofon ve 360 derece ses yakalama ozelligine sahip butce dostu konferans hoparloru.
- Grup kayitlarinda mikrofonun yeri, fiyatindan daha onemlidir — masanin ortasindaki bir iyi mikrofon, kenardaki pahalidan daha iyidir.
Kayit Kurallari
Iyi bir mikrofonla bile temel kurallari goz ardi ederseniz kotu bir kayit elde edebilirsiniz.
Ortam secimi:
- Pencereleri ve kapilari kapatin
- Klimayi, vantilatoru, nem aliciyi kapatin — surekli gurultu kaynagi olan her seyi
- Yumusak mobilya, perde, hali yardimcinizdir — yankiyi emerler
- Bos duvarlari olan bos odalardan kacinin — guclu yanki yaratirlar
Mikrofona mesafe:
- Ideal: Agizdan mikrofona 15-30 cm
- Cok yakin (<10 cm): patlayici unsuzler (p, b, t) kayitta "pop" sesi olusturur
- Cok uzak (>50 cm): sesiniz oda seslerinde kaybolur
- Masa mikrofonu icin pop filtresi kullanin — nefes seslerini gideren ucuz bir file
Ses seviyesi:
- Kayda baslamadan once kayit uygulamanizda seviyeyi kontrol edin
- Ideal aralik: -12 ile -6 dB arasi (tepe seviyesi)
- Gosterge kirmizi bolgeye geliyorsa mikrofonu asiri yukluyor ve ses bozulacaktir
- Biraz daha sessiz kaydetmek daha iyidir — ses seviyesini sonradan artirabilirsiniz, ancak bozulmayi gideremezsiniz
Kayit formati:
- WAV veya FLAC — maksimum kalite (kayipsiz)
- MP3 320 kbps — dosya boyutu onemliyse kabul edilebilir uzlasma
- MP3 128 kbps ve alti — belirgin kalite kaybi, onemli kayitlar icin kacinilmali
- Cogu kayit uygulamasi format secmenize izin verir — WAV secin
Toplanti ve Arama Kaydi
Yuz yuze toplantilar:
- Mikrofonu masanin ortasina yerlestirin
- 6'dan fazla katilimci varsa birden fazla mikrofon veya konferans hoparloru kullanin
- Katilimcilardan birbirlerinin sozunu kesmemelerini isteyin — en iyi diyarizasyon algoritmasi bile es zamanli konusmayi ayiramaz
Zoom/Teams/Google Meet kaydi:
- Platformun dahili kayit ozelligini kullanin — ses dogrudan yakalanir, hoparlor ve mikrofon uzerinden gecmez
- Zoom'da: Ayarlar → Kayit → "Her katilimci icin ayri ses dosyasi kaydet" — diyarizasyonlu transkripsiyon icin ideal
- Alternatif: OBS Studio (ucretsiz) herhangi bir kaynaktan sistem sesini kaydedebilir
Telefon gorusmesi kaydi:
- iPhone'da: dahili arama kaydi yoktur; TapeACall veya Rev Call Recorder kullanin
- Android'de: ACR (Another Call Recorder) veya Cube ACR
- Arama kayit kalitesi her zaman dusuktur — telefon aglari sikistirilmis codec'ler kullanir. Bu normaldir; Whisper bu kalite seviyesini iyi yonetir
Transkripsiyon Oncesi Ses Isleme
Kayit zaten yapildi ve kalite ideal degilse her sey kayip degil. Temel isleme, transkripsiyon sonuclarini onemli olcude iyilestirebilir.
Gurultu Azaltma
Audacity (ucretsiz, Windows/Mac/Linux):
Audacity, en populer ucretsiz ses duzenleme programidir. Adim adim gurultu azaltma rehberi:
- Dosyanizi Audacity'de acin
- Kimsenin konusmadigi ancak arka plan gurultusunun duyuldugu bir bolum bulun (en az 1-2 saniye)
- Bu bolumu fareyle secin
- Menu: Efektler → Gurultu Azaltma → "Gurultu Profili Al"
- Tum kaydi secin (Ctrl+A)
- Menu: Efektler → Gurultu Azaltma → parametreleri ayarlayin:
- Gurultu azaltma: 12-18 dB (12'den baslayin, gurultu devam ederse artirin)
- Hassasiyet: 6-8
- Frekans yumusatma: 3-6
- Kontrol icin "Onizleme"ye, ardindan "Tamam"a tiklayin
Adobe Podcast Enhance (ucretsiz cevrimici arac):
Adobe, podcast.adobe.com/enhance adresinde ucretsiz bir ses iyilestirme araci sunar. Dosyanizi yukleyin — yapay zeka otomatik olarak gurultuyu kaldirir, ses netligini arttirir ve ses seviyesini normallestirir. Sinir: 1 saate kadar dosyalar. Sonuclar etkileyicidir — genellikle elle islemeden daha iyi.
FFmpeg (komut satiri):
Otomasyonu tercih edenler icin FFmpeg guclu filtreler sunar. afftdn filtresi FFT tabanli uyarlanabilir gurultu azaltma saglar. Daha agresif gurultu giderme icin gurultu azaltma parametresini 30-40'a yukseltebilirsiniz. silenceremove filtresi uzun duraklamalari kaldirmaya yardimci olur.
Ses Seviyesi Normalizasyonu
Normalizasyon kayit seviyesini esitler — sessiz konusma daha yuksek, tepe noktalar daha yumusak hale gelir.
Neden onemli:
- Whisper ve diger modeller uygun seviyedeki sesle daha iyi calisir
- Bir kayitta farkli ses seviyelerinde birden fazla konusmaci varsa normalizasyon onlari dengeler
- Sessiz bolumler genellikle hatali transkribe edilir
Audacity'de nasil yapilir:
- Dosyanizi acin
- Tum kaydi secin (Ctrl+A)
- Menu: Efektler → Normalizasyon
- Tepe genlik: -1.0 dB olarak ayarlayin
- "Tamam"a tiklayin
Daha gelismis normalizasyon icin Kompresoru (Efektler → Kompresor) kullanin — sesli ve sessiz bolumler arasindaki farki tepeleri kesmeden esitler.
Format Donusumu
Transkripsiyon icin optimal bir ses formati vardir. Diktovka yuklenen dosyalari otomatik olarak donusturur, ancak kendiniz isliyorsaniz ideal parametreler sunlardir:
Transkripsiyon icin optimal parametreler:
- Kanallar: Mono (1 kanal)
- Ornekleme hizi: 16.000 Hz (16 kHz)
- Bit derinligi: 16-bit
- Format: WAV veya Opus
Mono neden stereodan daha iyi:
- Konusma tanima modelleri mono sinyalle calisir
- Stereo dosya islenmeden once mono'ya donusturulur — bu gereksiz bir adimdir
- Mono'da ses, arka plan gurultusune gore daha gucludur
- Dosya boyutu yari yarisina duser
Audacity'de: Parcalar → Karistir → Stereoyu Mono'ya Indir. Ardindan: Proje → Hiz → 16000 Hz. Disari aktar: Dosya → Disari Aktar → WAV 16-bit.
Yaygin Sorunlar ve Cozumler
| Sorun | Neden | Cozum |
|---|---|---|
| Arka plan gurultusu (ugultu, cizilti) | Klima, elektronik cihazlar, trafik | Audacity veya Adobe Enhance ile gurultu azaltma |
| Yanki ve reverb | Bos oda, ciplak duvarlar | Yanki giderme filtresi; gelecekte yumusak mobilyali oda kullanin |
| Sessiz konusma | Mikrofondan cok uzak | Normalizasyon; kayit sirasinda mikrofona yaklasma |
| Ust uste konusma | Kisiler ayni anda konusuyor | Tamamen duzeltilemez, ancak Diktovka'nin diyarizasyonu konusmacilari ayirmaya yardimci olur |
| Arka plan muzigi | Radyo, ortam muzigi | Vokal izolasyon araclari (UVR5, Demucs); en iyisi: kayit sirasinda muzigi kapatin |
| Pop ve tiklamalar | Mikrofona cok yakin, pop filtresi yok | Audacity'de de-click filtresi; pop filtresi kullanin veya mikrofona 45 derece acili konusun |
| Bozulma (klipleme) | Mikrofon asiri yuklenmesi | Sonradan duzeltilemez; kayit oncesi giris seviyesini dusurun |
| Telefon kalitesi | Sikistirilmis ses codec'i | Normalizasyon + hafif gurultu azaltma; mumkunse VoIP kullanin |
Diktovka Sesinizi Otomatik Olarak Optimize Eder
Diktovka platformu dosyanizi yuklediginizde temel hazirlama adimlarini otomatik olarak gerceklestirir:
- Format donusumu — optimal formata (mono, 16 kHz, Opus 32 kbps)
- FFmpeg isleme — temel normalizasyon ve sinyal hazirlama
- Konusmaci diyarizasyonu — kimin konustugunu otomatik tespit
- Yapay zeka ozetleme — kaydin kisa ozeti
Platform ideal olmayan kayitlarla bile basa cikar — telefon gorusmeleri, gurultulu toplanti kayitlari, sesli mesajlar. Ancak kaynak kalitesi ne kadar iyiyse sonuc o kadar dogru olur. Haziirliga 10 dakika yatirim yapmak, onemli olcude daha dogru bir transkripsiyon saglar.
Kayit Oncesi Kontrol Listesi
Yazdirun veya kaydedin — her onemli kayittan once kontrol edin:
- Mikrofon bagli ve sistem ayarlarinda giris cihazi olarak secili
- Test kaydi yapildi — 10 saniye dinleyin, sesin temiz oldugunu dogrulayin
- Ortam sessiz — pencereler kapali, gurultulu cihazlar kapali
- Mikrofona mesafe — 15-30 cm (veya yaka mikrofonu agizdan 15-20 cm)
- Kayit seviyesi — tepe degerler -12 ile -6 dB arasi, kirmizi bolgeye degmiyor
- Kayit formati — WAV veya FLAC (MP3 128 kbps degil)
- Yeterli disk alani — WAV yaklasik 10 MB/dakika kullanir
- Katilimcilardan isteyin — birbirlerinin sozunu kesmemelerini ve net konusmalarini
- Pop filtresi yerinde (masa mikrofonu icin)
- Kayit baslatildi — bariz gorunur, ama sanildiginden daha sik unutulur
Sonuc
Transkripsiyon icin ses kalitesini artirmak roket bilimi degildir. 250-3.000 TL'lik iyi bir mikrofon, sessiz bir oda ve dogru kayit ayarlari sonucun %80'ini saglar. Kalan %20 ise Audacity veya Adobe Enhance ile son islemdir.
Hazirlanan sesinizi Diktovka'ya yukleyin — ve neredeyse hic duzenleme gerektirmeyen bir transkripsiyon elde edin.
FAQ
Transkripsiyon icin en uygun mikrofon hangisidir?
Masa basi kaydi icin USB mikrofon en iyisidir: butce dostu Fifine K669 (~250 TL) veya en iyi kalite icin Blue Yeti (~3 000 TL). Roportajlar icin Boya BY-M1 (~200 TL) yaka mikrofonu. Toplantilar icin Jabra Speak 510 speakerfon. Butce dostu bir dis mikrofon bile dizustu bilgisayarin yerlesik mikrofonundan cok daha iyidir.
Transkripsiyon oncesi ses kaydindaki gurultuyu nasil gideririm?
Ucretsiz Audacity'de: arka plan guruuultusu olan sessiz bir bolum bulun, secin, 'Gurultu Profili Al' uygulayip ardindan tum kaydi secip 'Gurultu Azaltma' (12-18 dB) calistirin. Daha kolay bir secenek, yapay zeka ile sesi otomatik temizleyen Adobe Podcast Enhance'dir (ucretsiz cevrimici arac).
Iyi bir transkripsiyon icin gereken minimum ses kalitesi nedir?
%5-8 WER (minimum duzenleme) icin sessiz bir odada 15-30 cm mesafede dis mikrofon ile kayit yapmaniz yeterlidir. WAV veya MP3 320 kbps formati kullanin. Gurultulu kayitlarda WER %15-25'e, kotu kalitede (yanki, kisik ses) %25-40'a cikar ve ciddi duzenleme gerektirir.
Transkripsiyon icin en iyi ses formati hangisidir?
Optimal ayarlar: mono, 16 kHz, 16-bit WAV. Mono, stereodan daha iyidir — konusma tanima modelleri tek kanalli sinyalle calisir, ses arka plan gurultusu ne gore daha gucludur ve dosya boyutu yari yarisadir. MP3 128 kbps ve altindan kacinin — belirgin kalite kaybi olur.
FFmpeg ile bir kaydi nasil iyilestirebilirim?
FFmpeg, FFT tabanli uyarlanabilir gurultu azaltma icin afftdn filtresini sunar. Daha agresif gurultu azaltma icin noise reduction parametresini 30-40'a cikarin. silenceremove filtresi uzun duraklatimlari kaldirarak isleme suresinden tasarruf saglar. Optimal format donusuumu: mono, 16 kHz, 16-bit.