Tüm makaleler

Transkripsiyon icin Ses Kalitesini Nasil Artirirsiniz: Kapsamli Rehber

·15 dk okuma

Ses kaydi kalitesi, transkripsiyonun dogrulugunu belirleyen en onemli faktordur. OpenAI Whisper dahil en gelismis konusma tanima modelleri bile gurultulu, sessiz veya bozuk kayitlarda onemli olcude daha kotu sonuclar verir. Bu rehberde temiz ses kaydetmek ve dosyalarinizi transkripsiyona hazirlamak icin somut adimlar bulacaksiniz.


Ses Kalitesi Neden Bu Kadar Onemli

Kayit kalitesi ile transkripsiyon dogrulugu arasindaki iliski dogrudan ve olculebilirdir. Sektorde standart metrik WER (Word Error Rate) — yanlis tanilan kelimelerin yuzdesini ifade eder.

Tipik WER degerleri:

%5 ile %25 WER arasindaki fark, "kopyala ve kullan" ile "elle duzeltmeye bir saat harca" arasindaki farktir. Kayit hazirligina 10 dakika yatirim yapmak, saatlerce duzenleme zamani kazandirir.


Temiz Ses Nasil Kaydedilir

Mikrofon Secimi

Dizustu bilgisayarinizin dahili mikrofonu, transkripsiyon icin en kotu secenektir. Odadaki tum sesleri yakalar: klavye tiklama sesleri, fan gurultusu, sokak sesleri. Butcesi uygun bir harici mikrofon bile dramatik olcude daha iyi sonuc verir.

USB mikrofonlar (masa basinda kayit icin):

Yaka mikrofonlari (roportajlar ve gorusmeler icin):

Toplantilar ve grup kayitlari icin:

Kayit Kurallari

Iyi bir mikrofonla bile temel kurallari goz ardi ederseniz kotu bir kayit elde edebilirsiniz.

Ortam secimi:

Mikrofona mesafe:

Ses seviyesi:

Kayit formati:

Toplanti ve Arama Kaydi

Yuz yuze toplantilar:

Zoom/Teams/Google Meet kaydi:

Telefon gorusmesi kaydi:


Transkripsiyon Oncesi Ses Isleme

Kayit zaten yapildi ve kalite ideal degilse her sey kayip degil. Temel isleme, transkripsiyon sonuclarini onemli olcude iyilestirebilir.

Gurultu Azaltma

Audacity (ucretsiz, Windows/Mac/Linux):

Audacity, en populer ucretsiz ses duzenleme programidir. Adim adim gurultu azaltma rehberi:

  1. Dosyanizi Audacity'de acin
  2. Kimsenin konusmadigi ancak arka plan gurultusunun duyuldugu bir bolum bulun (en az 1-2 saniye)
  3. Bu bolumu fareyle secin
  4. Menu: Efektler → Gurultu Azaltma → "Gurultu Profili Al"
  5. Tum kaydi secin (Ctrl+A)
  6. Menu: Efektler → Gurultu Azaltma → parametreleri ayarlayin:
    • Gurultu azaltma: 12-18 dB (12'den baslayin, gurultu devam ederse artirin)
    • Hassasiyet: 6-8
    • Frekans yumusatma: 3-6
  7. Kontrol icin "Onizleme"ye, ardindan "Tamam"a tiklayin

Adobe Podcast Enhance (ucretsiz cevrimici arac):

Adobe, podcast.adobe.com/enhance adresinde ucretsiz bir ses iyilestirme araci sunar. Dosyanizi yukleyin — yapay zeka otomatik olarak gurultuyu kaldirir, ses netligini arttirir ve ses seviyesini normallestirir. Sinir: 1 saate kadar dosyalar. Sonuclar etkileyicidir — genellikle elle islemeden daha iyi.

FFmpeg (komut satiri):

Otomasyonu tercih edenler icin FFmpeg guclu filtreler sunar. afftdn filtresi FFT tabanli uyarlanabilir gurultu azaltma saglar. Daha agresif gurultu giderme icin gurultu azaltma parametresini 30-40'a yukseltebilirsiniz. silenceremove filtresi uzun duraklamalari kaldirmaya yardimci olur.

Ses Seviyesi Normalizasyonu

Normalizasyon kayit seviyesini esitler — sessiz konusma daha yuksek, tepe noktalar daha yumusak hale gelir.

Neden onemli:

Audacity'de nasil yapilir:

  1. Dosyanizi acin
  2. Tum kaydi secin (Ctrl+A)
  3. Menu: Efektler → Normalizasyon
  4. Tepe genlik: -1.0 dB olarak ayarlayin
  5. "Tamam"a tiklayin

Daha gelismis normalizasyon icin Kompresoru (Efektler → Kompresor) kullanin — sesli ve sessiz bolumler arasindaki farki tepeleri kesmeden esitler.

Format Donusumu

Transkripsiyon icin optimal bir ses formati vardir. Diktovka yuklenen dosyalari otomatik olarak donusturur, ancak kendiniz isliyorsaniz ideal parametreler sunlardir:

Transkripsiyon icin optimal parametreler:

Mono neden stereodan daha iyi:

Audacity'de: Parcalar → Karistir → Stereoyu Mono'ya Indir. Ardindan: Proje → Hiz → 16000 Hz. Disari aktar: Dosya → Disari Aktar → WAV 16-bit.


Yaygin Sorunlar ve Cozumler

SorunNedenCozum
Arka plan gurultusu (ugultu, cizilti)Klima, elektronik cihazlar, trafikAudacity veya Adobe Enhance ile gurultu azaltma
Yanki ve reverbBos oda, ciplak duvarlarYanki giderme filtresi; gelecekte yumusak mobilyali oda kullanin
Sessiz konusmaMikrofondan cok uzakNormalizasyon; kayit sirasinda mikrofona yaklasma
Ust uste konusmaKisiler ayni anda konusuyorTamamen duzeltilemez, ancak Diktovka'nin diyarizasyonu konusmacilari ayirmaya yardimci olur
Arka plan muzigiRadyo, ortam muzigiVokal izolasyon araclari (UVR5, Demucs); en iyisi: kayit sirasinda muzigi kapatin
Pop ve tiklamalarMikrofona cok yakin, pop filtresi yokAudacity'de de-click filtresi; pop filtresi kullanin veya mikrofona 45 derece acili konusun
Bozulma (klipleme)Mikrofon asiri yuklenmesiSonradan duzeltilemez; kayit oncesi giris seviyesini dusurun
Telefon kalitesiSikistirilmis ses codec'iNormalizasyon + hafif gurultu azaltma; mumkunse VoIP kullanin

Diktovka Sesinizi Otomatik Olarak Optimize Eder

Diktovka platformu dosyanizi yuklediginizde temel hazirlama adimlarini otomatik olarak gerceklestirir:

Platform ideal olmayan kayitlarla bile basa cikar — telefon gorusmeleri, gurultulu toplanti kayitlari, sesli mesajlar. Ancak kaynak kalitesi ne kadar iyiyse sonuc o kadar dogru olur. Haziirliga 10 dakika yatirim yapmak, onemli olcude daha dogru bir transkripsiyon saglar.


Kayit Oncesi Kontrol Listesi

Yazdirun veya kaydedin — her onemli kayittan once kontrol edin:

  1. Mikrofon bagli ve sistem ayarlarinda giris cihazi olarak secili
  2. Test kaydi yapildi — 10 saniye dinleyin, sesin temiz oldugunu dogrulayin
  3. Ortam sessiz — pencereler kapali, gurultulu cihazlar kapali
  4. Mikrofona mesafe — 15-30 cm (veya yaka mikrofonu agizdan 15-20 cm)
  5. Kayit seviyesi — tepe degerler -12 ile -6 dB arasi, kirmizi bolgeye degmiyor
  6. Kayit formati — WAV veya FLAC (MP3 128 kbps degil)
  7. Yeterli disk alani — WAV yaklasik 10 MB/dakika kullanir
  8. Katilimcilardan isteyin — birbirlerinin sozunu kesmemelerini ve net konusmalarini
  9. Pop filtresi yerinde (masa mikrofonu icin)
  10. Kayit baslatildi — bariz gorunur, ama sanildiginden daha sik unutulur

Sonuc

Transkripsiyon icin ses kalitesini artirmak roket bilimi degildir. 250-3.000 TL'lik iyi bir mikrofon, sessiz bir oda ve dogru kayit ayarlari sonucun %80'ini saglar. Kalan %20 ise Audacity veya Adobe Enhance ile son islemdir.

Hazirlanan sesinizi Diktovka'ya yukleyin — ve neredeyse hic duzenleme gerektirmeyen bir transkripsiyon elde edin.

FAQ

Transkripsiyon icin en uygun mikrofon hangisidir?

Masa basi kaydi icin USB mikrofon en iyisidir: butce dostu Fifine K669 (~250 TL) veya en iyi kalite icin Blue Yeti (~3 000 TL). Roportajlar icin Boya BY-M1 (~200 TL) yaka mikrofonu. Toplantilar icin Jabra Speak 510 speakerfon. Butce dostu bir dis mikrofon bile dizustu bilgisayarin yerlesik mikrofonundan cok daha iyidir.

Transkripsiyon oncesi ses kaydindaki gurultuyu nasil gideririm?

Ucretsiz Audacity'de: arka plan guruuultusu olan sessiz bir bolum bulun, secin, 'Gurultu Profili Al' uygulayip ardindan tum kaydi secip 'Gurultu Azaltma' (12-18 dB) calistirin. Daha kolay bir secenek, yapay zeka ile sesi otomatik temizleyen Adobe Podcast Enhance'dir (ucretsiz cevrimici arac).

Iyi bir transkripsiyon icin gereken minimum ses kalitesi nedir?

%5-8 WER (minimum duzenleme) icin sessiz bir odada 15-30 cm mesafede dis mikrofon ile kayit yapmaniz yeterlidir. WAV veya MP3 320 kbps formati kullanin. Gurultulu kayitlarda WER %15-25'e, kotu kalitede (yanki, kisik ses) %25-40'a cikar ve ciddi duzenleme gerektirir.

Transkripsiyon icin en iyi ses formati hangisidir?

Optimal ayarlar: mono, 16 kHz, 16-bit WAV. Mono, stereodan daha iyidir — konusma tanima modelleri tek kanalli sinyalle calisir, ses arka plan gurultusu ne gore daha gucludur ve dosya boyutu yari yarisadir. MP3 128 kbps ve altindan kacinin — belirgin kalite kaybi olur.

FFmpeg ile bir kaydi nasil iyilestirebilirim?

FFmpeg, FFT tabanli uyarlanabilir gurultu azaltma icin afftdn filtresini sunar. Daha agresif gurultu azaltma icin noise reduction parametresini 30-40'a cikarin. silenceremove filtresi uzun duraklatimlari kaldirarak isleme suresinden tasarruf saglar. Optimal format donusuumu: mono, 16 kHz, 16-bit.