Transkripsiyon icin Ses Kalitesini Nasil Artirirsiniz: Kapsamli Rehber

28 Mart 2026·15 dk okuma

Ses kaydi kalitesi, transkripsiyonun dogrulugunu belirleyen en onemli faktordur. OpenAI Whisper dahil en gelismis konusma tanima modelleri bile gurultulu, sessiz veya bozuk kayitlarda onemli olcude daha kotu sonuclar verir. Bu rehberde temiz ses kaydetmek ve dosyalarinizi transkripsiyona hazirlamak icin somut adimlar bulacaksiniz.

Ses Kalitesi Neden Bu Kadar Onemli

Kayit kalitesi ile transkripsiyon dogrulugu arasindaki iliski dogrudan ve olculebilirdir. Sektorde standart metrik WER (Word Error Rate) — yanlis tanilan kelimelerin yuzdesini ifade eder.

Tipik WER degerleri:

Temiz studyo kaydi: %3-5 hata — neredeyse mukemmel transkripsiyon
Sessiz ortamda iyi kayit: %5-8 — minimum duzenleme gerekir
Arka plan gurultusu olan kayit: %15-25 — her 4-6 kelimeden biri hatali
Kotu kalite kayit (gurultu, yanki, kisik ses): %25-40 — metin ciddi duzenleme gerektirir

%5 ile %25 WER arasindaki fark, "kopyala ve kullan" ile "elle duzeltmeye bir saat harca" arasindaki farktir. Kayit hazirligina 10 dakika yatirim yapmak, saatlerce duzenleme zamani kazandirir.

Temiz Ses Nasil Kaydedilir

Mikrofon Secimi

Dizustu bilgisayarinizin dahili mikrofonu, transkripsiyon icin en kotu secenektir. Odadaki tum sesleri yakalar: klavye tiklama sesleri, fan gurultusu, sokak sesleri. Butcesi uygun bir harici mikrofon bile dramatik olcude daha iyi sonuc verir.

USB mikrofonlar (masa basinda kayit icin):

Fifine K669 (~250 TL) — butce dostu kondanser USB mikrofon. Fiyatina gore mukemmel kalite, dogrudan bilgisayara baglanir. Baslangic icin ideal.
Maono AU-903 (~400 TL) — kompakt USB-C mikrofon, gurultu azaltma ozelligi var. Hem dizustu bilgisayarlarla hem de akilli telefonlarla calisir.
Blue Yeti (~3 000 TL) — USB mikrofonlarin klasigi. Dort kutupsal desen, mukemmel kalite. Butceniz elveriyorsa en iyi secim.

Yaka mikrofonlari (roportajlar ve gorusmeler icin):

Boya BY-M1 (~200 TL) — kablolu yaka mikrofonu, fiyat/performans orani mukemmel. 3.5 mm jak ile baglanir.
Boya BY-WM4 (~800 TL) — kablosuz yaka mikrofonu. Hareket ozgurlugu + iyi kalite.
Yaka mikrofonunu agizdan 15-20 cm mesafeye yaklastirin — bu, arka plan gurultusuz temiz ses saglar.

Toplantilar ve grup kayitlari icin:

Jabra Speak 510 (~2 500 TL) — cok yonlu mikrofona sahip konferans hoparloru. Masanin her tarafindan sesleri yakalar.
Anker PowerConf (~1 500 TL) — 6 dahili mikrofon ve 360 derece ses yakalama ozelligine sahip butce dostu konferans hoparloru.
Grup kayitlarinda mikrofonun yeri, fiyatindan daha onemlidir — masanin ortasindaki bir iyi mikrofon, kenardaki pahalidan daha iyidir.

Kayit Kurallari

Iyi bir mikrofonla bile temel kurallari goz ardi ederseniz kotu bir kayit elde edebilirsiniz.

Ortam secimi:

Pencereleri ve kapilari kapatin
Klimayi, vantilatoru, nem aliciyi kapatin — surekli gurultu kaynagi olan her seyi
Yumusak mobilya, perde, hali yardimcinizdir — yankiyi emerler
Bos duvarlari olan bos odalardan kacinin — guclu yanki yaratirlar

Mikrofona mesafe:

Ideal: Agizdan mikrofona 15-30 cm
Cok yakin (<10 cm): patlayici unsuzler (p, b, t) kayitta "pop" sesi olusturur
Cok uzak (>50 cm): sesiniz oda seslerinde kaybolur
Masa mikrofonu icin pop filtresi kullanin — nefes seslerini gideren ucuz bir file

Ses seviyesi:

Kayda baslamadan once kayit uygulamanizda seviyeyi kontrol edin
Ideal aralik: -12 ile -6 dB arasi (tepe seviyesi)
Gosterge kirmizi bolgeye geliyorsa mikrofonu asiri yukluyor ve ses bozulacaktir
Biraz daha sessiz kaydetmek daha iyidir — ses seviyesini sonradan artirabilirsiniz, ancak bozulmayi gideremezsiniz

Kayit formati:

WAV veya FLAC — maksimum kalite (kayipsiz)
MP3 320 kbps — dosya boyutu onemliyse kabul edilebilir uzlasma
MP3 128 kbps ve alti — belirgin kalite kaybi, onemli kayitlar icin kacinilmali
Cogu kayit uygulamasi format secmenize izin verir — WAV secin

Toplanti ve Arama Kaydi

Yuz yuze toplantilar:

Mikrofonu masanin ortasina yerlestirin
6'dan fazla katilimci varsa birden fazla mikrofon veya konferans hoparloru kullanin
Katilimcilardan birbirlerinin sozunu kesmemelerini isteyin — en iyi diyarizasyon algoritmasi bile es zamanli konusmayi ayiramaz

Zoom/Teams/Google Meet kaydi:

Platformun dahili kayit ozelligini kullanin — ses dogrudan yakalanir, hoparlor ve mikrofon uzerinden gecmez
Zoom'da: Ayarlar → Kayit → "Her katilimci icin ayri ses dosyasi kaydet" — diyarizasyonlu transkripsiyon icin ideal
Alternatif: OBS Studio (ucretsiz) herhangi bir kaynaktan sistem sesini kaydedebilir

Telefon gorusmesi kaydi:

iPhone'da: dahili arama kaydi yoktur; TapeACall veya Rev Call Recorder kullanin
Android'de: ACR (Another Call Recorder) veya Cube ACR
Arama kayit kalitesi her zaman dusuktur — telefon aglari sikistirilmis codec'ler kullanir. Bu normaldir; Whisper bu kalite seviyesini iyi yonetir

Transkripsiyon Oncesi Ses Isleme

Kayit zaten yapildi ve kalite ideal degilse her sey kayip degil. Temel isleme, transkripsiyon sonuclarini onemli olcude iyilestirebilir.

Gurultu Azaltma

Audacity (ucretsiz, Windows/Mac/Linux):

Audacity, en populer ucretsiz ses duzenleme programidir. Adim adim gurultu azaltma rehberi:

Dosyanizi Audacity'de acin
Kimsenin konusmadigi ancak arka plan gurultusunun duyuldugu bir bolum bulun (en az 1-2 saniye)
Bu bolumu fareyle secin
Menu: Efektler → Gurultu Azaltma → "Gurultu Profili Al"
Tum kaydi secin (Ctrl+A)
Menu: Efektler → Gurultu Azaltma → parametreleri ayarlayin:
- Gurultu azaltma: 12-18 dB (12'den baslayin, gurultu devam ederse artirin)
- Hassasiyet: 6-8
- Frekans yumusatma: 3-6
Kontrol icin "Onizleme"ye, ardindan "Tamam"a tiklayin

Adobe Podcast Enhance (ucretsiz cevrimici arac):

Adobe, podcast.adobe.com/enhance adresinde ucretsiz bir ses iyilestirme araci sunar. Dosyanizi yukleyin — yapay zeka otomatik olarak gurultuyu kaldirir, ses netligini arttirir ve ses seviyesini normallestirir. Sinir: 1 saate kadar dosyalar. Sonuclar etkileyicidir — genellikle elle islemeden daha iyi.

FFmpeg (komut satiri):

Otomasyonu tercih edenler icin FFmpeg guclu filtreler sunar. afftdn filtresi FFT tabanli uyarlanabilir gurultu azaltma saglar. Daha agresif gurultu giderme icin gurultu azaltma parametresini 30-40'a yukseltebilirsiniz. silenceremove filtresi uzun duraklamalari kaldirmaya yardimci olur.

Ses Seviyesi Normalizasyonu

Normalizasyon kayit seviyesini esitler — sessiz konusma daha yuksek, tepe noktalar daha yumusak hale gelir.

Neden onemli:

Whisper ve diger modeller uygun seviyedeki sesle daha iyi calisir
Bir kayitta farkli ses seviyelerinde birden fazla konusmaci varsa normalizasyon onlari dengeler
Sessiz bolumler genellikle hatali transkribe edilir

Audacity'de nasil yapilir:

Dosyanizi acin
Tum kaydi secin (Ctrl+A)
Menu: Efektler → Normalizasyon
Tepe genlik: -1.0 dB olarak ayarlayin
"Tamam"a tiklayin

Daha gelismis normalizasyon icin Kompresoru (Efektler → Kompresor) kullanin — sesli ve sessiz bolumler arasindaki farki tepeleri kesmeden esitler.

Format Donusumu

Transkripsiyon icin optimal bir ses formati vardir. Диктовка yuklenen dosyalari otomatik olarak donusturur, ancak kendiniz isliyorsaniz ideal parametreler sunlardir:

Transkripsiyon icin optimal parametreler:

Kanallar: Mono (1 kanal)
Ornekleme hizi: 16.000 Hz (16 kHz)
Bit derinligi: 16-bit
Format: WAV veya Opus

Mono neden stereodan daha iyi:

Konusma tanima modelleri mono sinyalle calisir
Stereo dosya islenmeden once mono'ya donusturulur — bu gereksiz bir adimdir
Mono'da ses, arka plan gurultusune gore daha gucludur
Dosya boyutu yari yarisina duser

Audacity'de: Parcalar → Karistir → Stereoyu Mono'ya Indir. Ardindan: Proje → Hiz → 16000 Hz. Disari aktar: Dosya → Disari Aktar → WAV 16-bit.

Yaygin Sorunlar ve Cozumler

Sorun	Neden	Cozum
Arka plan gurultusu (ugultu, cizilti)	Klima, elektronik cihazlar, trafik	Audacity veya Adobe Enhance ile gurultu azaltma
Yanki ve reverb	Bos oda, ciplak duvarlar	Yanki giderme filtresi; gelecekte yumusak mobilyali oda kullanin
Sessiz konusma	Mikrofondan cok uzak	Normalizasyon; kayit sirasinda mikrofona yaklasma
Ust uste konusma	Kisiler ayni anda konusuyor	Tamamen duzeltilemez, ancak Диктовка'nin diyarizasyonu konusmacilari ayirmaya yardimci olur
Arka plan muzigi	Radyo, ortam muzigi	Vokal izolasyon araclari (UVR5, Demucs); en iyisi: kayit sirasinda muzigi kapatin
Pop ve tiklamalar	Mikrofona cok yakin, pop filtresi yok	Audacity'de de-click filtresi; pop filtresi kullanin veya mikrofona 45 derece acili konusun
Bozulma (klipleme)	Mikrofon asiri yuklenmesi	Sonradan duzeltilemez; kayit oncesi giris seviyesini dusurun
Telefon kalitesi	Sikistirilmis ses codec'i	Normalizasyon + hafif gurultu azaltma; mumkunse VoIP kullanin

Диктовка Sesinizi Otomatik Olarak Optimize Eder

Диктовка platformu dosyanizi yuklediginizde temel hazirlama adimlarini otomatik olarak gerceklestirir:

Format donusumu — optimal formata (mono, 16 kHz, Opus 32 kbps)
FFmpeg isleme — temel normalizasyon ve sinyal hazirlama
Konusmaci diyarizasyonu — kimin konustugunu otomatik tespit
Yapay zeka ozetleme — kaydin kisa ozeti

Platform ideal olmayan kayitlarla bile basa cikar — telefon gorusmeleri, gurultulu toplanti kayitlari, sesli mesajlar. Ancak kaynak kalitesi ne kadar iyiyse sonuc o kadar dogru olur. Haziirliga 10 dakika yatirim yapmak, onemli olcude daha dogru bir transkripsiyon saglar.

Kayit Oncesi Kontrol Listesi

Yazdirun veya kaydedin — her onemli kayittan once kontrol edin:

Mikrofon bagli ve sistem ayarlarinda giris cihazi olarak secili
Test kaydi yapildi — 10 saniye dinleyin, sesin temiz oldugunu dogrulayin
Ortam sessiz — pencereler kapali, gurultulu cihazlar kapali
Mikrofona mesafe — 15-30 cm (veya yaka mikrofonu agizdan 15-20 cm)
Kayit seviyesi — tepe degerler -12 ile -6 dB arasi, kirmizi bolgeye degmiyor
Kayit formati — WAV veya FLAC (MP3 128 kbps degil)
Yeterli disk alani — WAV yaklasik 10 MB/dakika kullanir
Katilimcilardan isteyin — birbirlerinin sozunu kesmemelerini ve net konusmalarini
Pop filtresi yerinde (masa mikrofonu icin)
Kayit baslatildi — bariz gorunur, ama sanildiginden daha sik unutulur

Sonuc

Transkripsiyon icin ses kalitesini artirmak roket bilimi degildir. 250-3.000 TL'lik iyi bir mikrofon, sessiz bir oda ve dogru kayit ayarlari sonucun %80'ini saglar. Kalan %20 ise Audacity veya Adobe Enhance ile son islemdir.

Hazirlanan sesinizi Диктовка'ya yukleyin — ve neredeyse hic duzenleme gerektirmeyen bir transkripsiyon elde edin.

FAQ

Transkripsiyon icin en uygun mikrofon hangisidir?

Masa basi kaydi icin USB mikrofon en iyisidir: butce dostu Fifine K669 (~250 TL) veya en iyi kalite icin Blue Yeti (~3 000 TL). Roportajlar icin Boya BY-M1 (~200 TL) yaka mikrofonu. Toplantilar icin Jabra Speak 510 speakerfon. Butce dostu bir dis mikrofon bile dizustu bilgisayarin yerlesik mikrofonundan cok daha iyidir.

Transkripsiyon oncesi ses kaydindaki gurultuyu nasil gideririm?

Ucretsiz Audacity'de: arka plan guruuultusu olan sessiz bir bolum bulun, secin, 'Gurultu Profili Al' uygulayip ardindan tum kaydi secip 'Gurultu Azaltma' (12-18 dB) calistirin. Daha kolay bir secenek, yapay zeka ile sesi otomatik temizleyen Adobe Podcast Enhance'dir (ucretsiz cevrimici arac).

Iyi bir transkripsiyon icin gereken minimum ses kalitesi nedir?

%5-8 WER (minimum duzenleme) icin sessiz bir odada 15-30 cm mesafede dis mikrofon ile kayit yapmaniz yeterlidir. WAV veya MP3 320 kbps formati kullanin. Gurultulu kayitlarda WER %15-25'e, kotu kalitede (yanki, kisik ses) %25-40'a cikar ve ciddi duzenleme gerektirir.

Transkripsiyon icin en iyi ses formati hangisidir?

Optimal ayarlar: mono, 16 kHz, 16-bit WAV. Mono, stereodan daha iyidir — konusma tanima modelleri tek kanalli sinyalle calisir, ses arka plan gurultusu ne gore daha gucludur ve dosya boyutu yari yarisadir. MP3 128 kbps ve altindan kacinin — belirgin kalite kaybi olur.

FFmpeg ile bir kaydi nasil iyilestirebilirim?

FFmpeg, FFT tabanli uyarlanabilir gurultu azaltma icin afftdn filtresini sunar. Daha agresif gurultu azaltma icin noise reduction parametresini 30-40'a cikarin. silenceremove filtresi uzun duraklatimlari kaldirarak isleme suresinden tasarruf saglar. Optimal format donusuumu: mono, 16 kHz, 16-bit.

Диктовка'i deneyin

←Tüm makaleler