Bütün məqalələr

Transkripsiya ucun audio keyfiyyetini nece yaxsilasdirir: tam beledci

·15 dəq oxuma

Audio qeydin keyfiyyeti transkripsiya deqiqliyini mueyyen eden en muhum amildir. Hetta OpenAI Whisper daxil en qabaqcil nitq taninma modelleri bele kurultulu, sakit ve ya tehrif olunmus qeydlerde xeyli pis neticeler verir. Bu beledcide temiz ses yazmaq ve fayllarinizi transkripsiyaya hazirlamaq ucun konkret addimlar var.


Audio keyfiyyeti neye goredir

Qeyd keyfiyyeti ile transkripsiya deqiqliyi arasindaki elaqe birbasdir ve olculedir. Senayede standart metrika WER (Word Error Rate) — sehv taninmis sozlerin faizini ifade edir.

Tipik WER gostericileri:

5% ve 25% WER arasindaki ferq "kopyala ve istifade et" ile "elle duzelise bir saat serf et" arasindaki ferqdir. Qeyd hazirliqina 10 deqiqe serflemek sizin saatlarla redakte vaxtinizi qenaat edir.


Temiz ses nece yazilir

Mikrofon secimi

Noutbukunuzun daxili mikrofonu transkripsiya ucun en pis secimdir. O, otaqdaki butun sesleri tutur: klaviatura tikiltisi, ventilyator kurultusu, kuce sesleri. Hetta buyceli xarici mikrofon belede dramatik sekilde daha yaxsi netice verecek.

USB mikrofonlar (masa basinda qeyd ucun):

Yaxalik mikrofonlar (musahibeler ve soghbetler ucun):

Toplanti ve qrup qeydleri ucun:

Qeyd qaydalari

Yaxsi mikrofonla bele esas qaydalara riyet etmesez pis qeyd elde ede bilersiniz.

Otaq secimi:

Mikrofona mesafe:

Ses seviyyesi:

Qeyd formati:

Toplanti ve zeng qeydleri

Uzbeuze toplantilar:

Zoom/Teams/Google Meet qeydi:

Telefon zengi qeydi:


Transkripsiya oncesi audio emali

Qeyd artiq edilib ve keyfiyyeti ideal deyilse — her sey itmis deyil. Esas emal transkripsiya neticelerini ehemiyyetli derecede yaxsilasdirir bilir.

Kuyu azaltma

Audacity (pulsuz, Windows/Mac/Linux):

Audacity en mehsur pulsuz audio redaktorudur. Budur addim-addim kuyu azaltma beledcisi:

  1. Faylinizi Audacity-de acin
  2. Heckesin danismadigi, amma arxa plan kurultusu esidilen bolme tapin (en azi 1-2 saniye)
  3. Bu bolmeni sican ile secin
  4. Menyu: Efektler → Kuyu azaltma → "Kuyu profili al"
  5. Butun qeydi secin (Ctrl+A)
  6. Menyu: Efektler → Kuyu azaltma → parametrleri tenzimelyin:
    • Kuyu azaltma: 12-18 dB (12-den baslayin, kurultu qalirsa arttirin)
    • Hessasliq: 6-8
    • Tezlik hamarlama: 3-6
  7. Yoxlamaq ucun "Onbaxish" tiklayin, sonra "OK"

Adobe Podcast Enhance (pulsuz onlayn alqet):

Adobe podcast.adobe.com/enhance unvaninda pulsuz ses yaxsilasdiirma aleti teklif edir. Faylinizi yukleyin — suni intellekt avtomatik olaraq kurulutu aradan qaldirir, ses aydinnligini arttirir ve ses seviyyesini normallasdirir. Mehdudiyyet: 1 saata qeder fayllar. Neticeler tehsirledicidirr — cox vaxt elle emaldan daha yaxsidir.

FFmpeg (emr setri):

Avtomatlasdiirmayi ustun tutanlar ucun FFmpeg guclu suzdecler teklif edir. afftdn suzdeci FFT esasli adaptiv kuyu azaltma temin edir. Daha aqressiv kuyu aradan qaldirmaq ucun kuyu azaltma parametrini 30-40-a arttirin. silenceremove suzdeci uzun faasilelerri kaldirmaga komek edir.

Ses seviyyesi normallasdirilmasi

Normallasdiirma qeyd seviyyesini beraberlesdirir — sakit danisiq daha ucadan, picler daha yumssaq olur.

Neye vacibdir:

Audacity-de nece edilir:

  1. Faylinizi acin
  2. Butun qeydi secin (Ctrl+A)
  3. Menyu: Efektler → Normallasdiirma
  4. Pic amplituda: -1.0 dB olaraq qoyun
  5. "OK" tiklayin

Daha qabaqcil normallasdiirma ucun Kompressoru istifade edin (Efektler → Kompressor) — picleri kesmeden sakit ve ucadan bolmeler arasindaki ferqi beraberlesdirir.

Format cevirme

Transkripsiya ucun optimal audio formati var. Diktovka yuklenen faylari avtomatik cevirir, amma elle emal edirsinizse — ideal parametrler bunlardir:

Transkripsiya ucun optimal parametrler:

Mono neye stereodan daha yaxsidir:

Audacity-de: Parcalar → Qarisiq → Stereonu Mono-ya cevir. Sonra: Layihe → Suret → 16000 Hz. Ixrac: Fayl → Ixrac → WAV 16-bit.


Yaygin problemler ve helleri

ProblemSebebiHelli
Arxa plan kurultusu (ugultu, fisslti)Kondisioner, elektronika, nqliyyatAudacity ve ya Adobe Enhance ile kuyu azaltma
Eks-seda ve reverberasiyaBos otaq, cilaqa divarlarDe-reverb filtri; gelecekde yumssaq mebell otaq istifade edin
Sakit sesMikrofondan cox uzaqNormallasdiirma; qeyd zamani mikrofona yaxinlasma
Ust-uste danisiqInsanlar eyni vaxtda danisirTam duzelde bilmez, amma Diktovka-nin diarizasiyasi danisanlari ayirmaga komek edir
Arxa plan muzikasiRadio, muhit muzikasiVokal izolyasiya aletleri (UVR5, Demucs); en yaxsisi: qeyd zamani muzikani sondurun
Pop ve tiklamalarMikrofona cox yaxin, pop filtri yoxdurAudacity-de de-click filtri; pop filtri istifade edin ve ya mikrofona 45 derece bucaqla danissin
Tehrif (klipinq)Mikrofon heddinden artiq yuklenmesiSonradan duzelde bilmez; qeydden evvel giris seviyyesini asagiladin
Telefon keyfiyyetiSixilmis ses kodekiNormallasdiirma + yungul kuyu azaltma; mumkunse VoIP istifade edin

Diktovka audionuzu avtomatik optimallasdirir

Diktovka platformasi fayl yuklediyiniz zaman esas hazirliq addimlarini avtomatik yerine yetirir:

Platforma ideal olmayan qeydlerle bele bas cixarir — telefon zengleri, kurultulu toplanti qeydleri, sesli mesajlar. Amma menbee keyfiyyeti ne qeder yaxsidirsa netice o qeder deqiq olur. Hazirliqqa 10 deqiqe serf etmek xeyli daha deqiq transkripsiya verir.


Qeydden evvel yoxlama siyahisi

Cap edin ve ya saxlayin — her muhum qeydden evvel yoxlayin:

  1. Mikrofon qosulub ve secsilib — sistemde giris cihazi olaraq
  2. Test qeydi edilib — 10 saniye dinleyin, sesin temiz oldugunu yoxlayin
  3. Otaq sakitdir — pencereler bagli, kurultulu cihazlar sondurulub
  4. Mikrofona mesafe — 15-30 sm (ve ya yaxalik agizdan 15-20 sm)
  5. Qeyd seviyyesi — picler -12 ile -6 dB arasinda, qirmizi zonaya deymir
  6. Qeyd formati — WAV ve ya FLAC (MP3 128 kbps deyil)
  7. Kifayet qeder disk yeri — WAV teqriben 10 MB/deq istifade edir
  8. Istiraakcilerden xahis edin — bir-birinin sozunu kesmemelerini ve aydin danismalarini
  9. Pop filtr yerinde (masa mikrofonu ucun)
  10. Qeyd basladildi — askar gorunnur, amma dusunduyunuzden daha tez-tez unudulur

Netice

Transkripsiya ucun audio keyfiyyetini yaxsilasdiirmaq raket elmi deyil. 45-190 AZN-lik yaxsi bir mikrofon, sakit otaq ve duzgun qeyd parametrleri neticenin 80%-ni temin edir. Qalan 20% ise Audacity ve ya Adobe Enhance ile son emaldir.

Hazirlanmis audionuzu Diktovka-ya yukleyin — ve demek olar ki redakte teleb etmeyen transkripsiya elde edin.

FAQ

Transkripsiya ucun en uygun mikrofon hansidir?

Masa ustu qeyd ucun USB mikrofon en yaxsisidir: budce varianthi Fifine K669 (~45 AZN) ve ya en yaxshi keyfiyyet ucun Blue Yeti (~190 AZN). Musahibeler ucun Boya BY-M1 (~25 AZN) yaxaliq mikrofonu. Iclaslar ucun Jabra Speak 510 spikerfon. Hetta budce xarici mikrofon bele noutbukun daxili mikrofonundan xeyli ustundur.

Transkripsiya oncesi audio qeydden sesmezliyi nece aradan qaldirmaq olar?

Pulsuz Audacity-de: arxa plan sesmezliyi olan sakit bir hisseni tapin, secin, 'Sesmezlik profili al' tetbiq edin, sonra butun qeydi secib 'Sesmezlik azaltma' (12-18 dB) ishledin. Daha asan variant — Adobe Podcast Enhance (pulsuz onlayn alet), suni intellekt vasitesile sesi avtomatik temizleyir.

Yaxshi transkripsiya ucun lazim olan minimum audio keyfiyyeti nedir?

5-8% WER deqiqliyi (minimal redakte) ucun sakit otaqda 15-30 sm mesafede xarici mikrofon ile qeyd kifayetdir. Format — WAV ve ya MP3 320 kbps. Sesmezlikli qeydlerde WER 15-25%-e, pis keyfiyyetde (eks-seda, sakit ses) 25-40%-e yuxselir ve ciddi manual redakte telebi olur.

Transkripsiya ucun en yaxshi audio formati hansidir?

Optimal parametrler: mono, 16 kHz, 16-bit WAV. Mono stereodan yaxsidir — danishiq tanima modelleri tek kanalli siqnalla isleyir, ses arxa plana nisbeten daha gucludur ve fayl iki defe kicikdir. MP3 128 kbps ve ashagi seviyelerde nazar cekecek keyfiyyet itgisi olduguna gore onlardan qacinii.

FFmpeg ile qeydi nece yaxsilashdirmaq olar?

FFmpeg FFT esasli adaptiv sesmezlik azaltma ucun afftdn filtresini teklif edir. Daha aqressiv sesmezlik azaltma ucun noise reduction parametrini 30-40-a artirin. silenceremove filtresi uzun faseseleri aradan qaldirır, isleme vaxtina qenaet edir. Optimal format cevrilmesi: mono, 16 kHz, 16-bit.