Bütün məqalələr

Rusca danışanlar üçün transkripsiya bazarı: 2025–2026 alətlərinin tam bələdçisi

·35 dəq oxuma

Sber-in GigaAM modeli rus nitqinin tanınmasında dominantlıq edir, dəqiqlik baxımından OpenAI-nin Whisper modelini təxminən iki dəfə qabaqlayır, GigaChat isə təəccüblü dərəcədə güclü pulsuz transkripsiya təklif edir. Rusca danışan istifadəçilər üçün transkripsiya bazarı əhəmiyyətli dərəcədə yetkinləşib: rus dilində öyrədilmiş open-source modellər indi əksər kommersiya çoxdilli servislərini üstələyir; Google Meet və Microsoft Teams kimi iri qərb platformaları rus subtitrləri tam dəstəkləyir; Yandex SpeechKit, SaluteSpeech, Войси kimi yerli servislər ekosistemi isə xüsusi olaraq MDB auditoriyası üçün yaradılıb. Apple nəzərəçarpan autsayder olaraq qalır — Voice Memos transkripsiyası hələ də rus dilini dəstəkləmir. Bu bələdçi rusca danışan istifadəçilərə əlçatan transkripsiya alətlərinin bütün kateqoriyalarını əhatə edir — pulsuz Telegram-botlardan enterprise API-yə qədər — hər biri üçün rus dilinin tanınma keyfiyyətinin dürüst qiymətləndirilməsi ilə.


Dəqiqlik fərqi: niyə model seçimi brend adından vacibdir

"Rus dilini dəstəkləyir" iddialarının hamısı eyni deyil. Alpha Cephei 2025 rus ASR benchmarkı, 11 müxtəlif rusca dataset üzərində (audiokitablar, çağrı mərkəzləri, TV yayımları, tibbi nitq) sınaqdan keçirilmiş, əhəmiyyətli fərqlər aşkar edib. Sber-in GigaAM2 modeli 8.4% WER (Word Error Rate) göstəricisinə çatıb, bu onu mütləq lider edir. Vosk 11.0% WER ilə arxadan gəlir, OpenAI Whisper Large V3 isə 16.2% WER ilə geridə qalıb — GigaAM-dan təxminən iki dəfə pis. NVIDIA-nın NeMo Canary V2 modeli yeniliyinə baxmayaraq, rus dilində 20.2% göstərib — məyusedici nəticə.

Bu o deməkdir ki, GigaAM-a əsaslanan alət təxminən hər 12 sözdən 1-ində səhv edəcək, Whisper-ə əsaslanan alət isə hər 6 sözdən 1-ində. Təmiz nitqdə (audiokitablar) bütün modellər yaxşı işləyir (Vosk heyrətamiz 1.2% WER göstəricisinə çatır). Əsl fərq səs-küylü, real audioda ortaya çıxır: çağrı mərkəzi qeydləri, kəsişən danışıqlar olan görüşlər, telefon keyfiyyəti. Burada GigaAM və Vosk Whisper-dən əhəmiyyətli dərəcədə irəlidədir.

ModelOrta WER (rus dili)Ən yaxşı tətbiqi
GigaAM2 CTC+LM (Sber)8.4%Ən yaxşı ümumi dəqiqlik
Vosk 0.54 (Alpha Cephei)11.0%Yüngül oflayn/edge
T-one (Tinkoff)12.8%Real vaxt striming
Whisper Podlodka Turbo13.8%Fine-tune edilmiş Whisper
NeMo FastConformer RU14.0%NVIDIA GPU ekosistemi
Whisper Large V316.2%Çoxdilli universal
NeMo Canary V220.2%AB dillərinin tərcüməsi

Pullu beynəlxalq servislər: hansılar həqiqətən rus dili ilə işləyir

Onlarla iri pullu transkripsiya platformasının arasında yalnız bir neçəsi rus dilini həqiqətən yaxşı dəstəkləyir. Otter.ai və Descript rus dilini ümumiyyətlə dəstəkləmir — Otter rusca audioda mənasız mətn çıxarır, Descript isə latın əlifbası olmayan bütün dilləri açıq şəkildə istisna edib. Notta rus dilini 58 dil arasında elan edir, lakin 2026-cı ildə müstəqil test göstərib ki, əgər dil əvvəlcədən əl ilə seçilməsə, başaçılmaz mətn çıxarır, hətta seçilsə belə keyfiyyət etibarsızdır.

Rus dili üçün ən güclü pullu variantlar iki səviyyəyə bölünür. GoTranscript rus dilini ana dili olaraq bilən insanların 100% insan transkripsiyası ilə 99.4% dəqiqliklə dəqiqlik baxımından liderdir, qiyməti dəqiqəyə $1.20–2.75, müddəti 1–3 gün. Happy Scribe həm AI (~85% dəqiqlik), həm də insan transkripsiyasını (99% dəqiqlik, $1.75–2.00/dəq) rus dili üçün xüsusi səhifə və regional aksentlər dəstəyi ilə təklif edir. Sonix şəffaf qiyməti ilə fərqlənir — saatına $10, elan edilmiş dəqiqlik 85–99%.

Tərtibatçılar üçün API servisləri vacibdir. Speechmatics on-premise yerləşdirməni (data suverenliyi üçün vacib) dəstəkləyir və səxavətli pulsuz tarif təklif edir — ayda 8 saat. AssemblyAI Universal-2 modelində 99 dildə rus dilini $0.15–0.27/saat qiymətlə əhatə edir, 95 dildə diarizasiya ilə. Deepgram ən aşağı API qiyməti təklif edir (~$0.46/saat), lakin benchmarklar rus dilinin dəqiqliyinin (~8% WER) rəqiblərdən bir qədər aşağı olduğunu göstərir. Maestra — ən funksional variant: transkripsiya, DeepL ilə tərcümə, səs klonlaması ilə AI-dublyaj və canlı subtitrlər — hamısı rus dilini dəstəkləyir, saatına $10-dan başlayaraq.

ServisRus dilinin keyfiyyətiQiymətƏn yaxşı tətbiqi
GoTranscriptİnsan, 99.4%$1.20–2.75/dəqMaksimal dəqiqlik
Happy ScribeAI + insan$17–49/ay + $2/dəqHibrid tapşırıqlar
SonixAI, 85-99%$10/saatŞəffaf AI qiymətləndirmə
SpeechmaticsAPI$0.30–0.70/saatEnterprise, on-prem
MaestraHamısı birində$10/saat–$359/ayÇoxdilli hamısı-birində
AssemblyAIAPI$0.15–0.27/saatTərtibatçılar üçün inteqrasiya
TranskriptorBüdcə$9.99–30/ayBüdcə variantı
TrintJurnalistika$52–100/ayJurnalistik tapşırıqlar

Rus dili ilə həqiqətən işləyən pulsuz variantlar

Ən güclü pulsuz alət — yerli quraşdırılmış OpenAI Whisper: limitsiz, tam gizli, large-v3 modelində rus dili üçün məqbul keyfiyyət. Texniki olmayan istifadəçilər masaüstü GUI istifadə edə bilər: Buzz (pulsuz, çoxplatformalı, bir neçə backend), Vibe (pulsuz, sadə, oflayn) və ya MacWhisper (kiçik modellərlə pulsuz versiya; Pro üçün $69 həmişəlik). Hamısı modeli yüklədikdən sonra oflayn işləyir.

Quraşdırma olmadan onlayn transkripsiya üçün: TurboScribe — gündə 3 pulsuz transkripsiya (hər biri 30 dəqiqəyə qədər), rus dili dillər siyahısında yüksək dəqiqliklə. Speech2Text.ru — spiker diarizasiyası ilə 3 pulsuz saat. Any2Text.ru — qeydiyyatsız 15 dəqiqə + qeydiyyatla 60 dəqiqə. Wonderscribe — tam pulsuz, lakin xəta faizi daha yüksək (~16% WER).

Telegram ekosistemində Voxbrief (@VidVKYT2AudioBot) fərqlənir — YouTube və VK videolarından audio çıxarmaq üçün pulsuz bot: link və ya fayl göndərin — istənilən servisdə transkripsiyaya hazır audio parça alın. Daxili Telegram Premium transkripsiyası Google Speech Recognition istifadə edir, rus dilini dəstəkləyir — pulsuz istifadəçilərə həftədə 2 transkripsiya, Premium abunəçilərə limitsiz.

Sber-in GigaChat modeli xüsusi diqqətə layiqdir. 2.0 yeniləməsi (mart 2025) nativ audio emalını əlavə etdi — 2 saata qədər faylı yükləyirsiniz və diarizasiya, ağıllı durğu işarələri və AI-xülasə ilə transkripsiya alırsınız. Veb (giga.chat), Telegram-bot və VK MAX vasitəsilə əlçatandır, abunəsiz və VPN-siz.


Böyük texnologiya platformaları: rusca transkripsiya harada

Apple — bütün ekosistemində rus dilini dəstək baxımından ən pisdir. Voice Memos transkripsiyası (iOS 18-də ortaya çıxdı) yalnız 10 dili dəstəkləyir — rus dili onların arasında yoxdur. Live Captions yalnız ingilis dili ilə məhdudlaşıb (ABŞ və Kanada). Apple Intelligence funksiyalarında da eyni məhdudiyyətlər var. Yeganə üstünlük — Siri dictation, iOS 8.3-dən (2015) bəri rus dilini dəstəkləyir və təmiz nitqdə kifayət qədər yaxşı işləyir, lakin istifadəçilər kiril mətninin latın əlifbasına geri dönmə xətalarını qeyd edir.

Google rus dilini ən geniş dəstəkləyir. Google Meet 2022-ci ilin dekabrından bəri rusca subtitrləri dəstəkləyir, hazırda subtitrlər üçün 87 dili və tərcümə subtitrləri üçün 69+ dili əhatə edir (pullu Workspace abunəlikləri). Google Docs Voice Typing rus dili və durğu işarələmə səs əmrləri ilə işləyir. YouTube 2012-ci ildən bəri rusca avto-subtitrlər təqdim edir, keyfiyyət dəyişkəndir (~60–70%). Google Cloud Speech-to-Text enterprise səviyyəsində rus dilinin tanınmasını təmin edir.

Microsoft Google-dan geri qalmır. Teams transkripsiyası və canlı subtitrləri 60+ dil arasında rus dilini tam dəstəkləyir, tərcümə subtitrləri Teams Premium vasitəsilə əlçatandır. Word/Office-də diktə rus dili ilə işləyir. Azure Speech-to-Text rus dilini tam dəstəkləyir: striming, toplu emal, xüsusi modellər. Boşluq: Windows Voice Access və Teams-dəki yeni AI Interpreter (əvvəlcə 9 dil) hələ rus dilini dəstəkləmir.

Zoom rus dilini dəstəkləyir — avto-subtitrlər (49 dil) və tərcümə subtitrləri (36 dil cütü, $5/ay). Lakin istifadəçilər tərcümə rusca subtitrlərin keyfiyyətini "qeyri-adekvat" adlandırır — Zoom rəsmi olaraq keyfiyyətin "rəqiblər səviyyəsində və ya daha yaxşı" olduğunu və daim yaxşılaşdığını cavab verib.


Rusiya və MDB servisləri: yerli meydanın üstünlüyü

Rusiya bazarı xüsusi olaraq rus nitq nümunələri, aksentlər və telefon keyfiyyətli audio üzərində öyrədilmiş bir neçə güclü yerli platforma yaradıb.

Yandex SpeechKit elan edilmiş 95–97% dəqiqlik və Alisa-da işləməsi ilə enterprise rus nitqinin tanınmasının qızıl standartı olaraq qalır. Yalnız API, istehlakçı məhsulu yoxdur, qiymət sinxron tanıma üçün ~₽0.64/dəq. SpeechKit Hybrid vasitəsilə on-premise dəstəkləyir — data suverenliyi tələbləri olan təşkilatlar üçün vacibdir. Dillər rus, ingilis və türk dilləri ilə məhdudlaşıb.

Sber SaluteSpeech — fiziki şəxslər üçün ayda 100 pulsuz dəqiqə (qeyri-kommersiya istifadəsi) ilə ən əlçatan Rusiya enterprise servisi. Windows və macOS üçün masaüstü tətbiqi tanımanı, sintezi və GigaChat-ı birləşdirir. Enterprise məhsulu SaluteSpeech Insights çağrı mərkəzi analitikası təmin edir.

Tinkoff VoiceKit (indi T-Bank) — dəqiqəyə ~₽0.40–0.45 qiymətlə ən ucuz Rusiya API-si, çağrı mərkəzi məlumatlarının terabaytları üzərində öyrədilib. ~95% dəqiqlik elan edir və təhsil müəssisələri üçün pulsuzdur.

VK Звонки 2023-cü ilin avqustunda öz neyroşəbəkəsində pulsuz daxili transkripsiyanı işə salıb — vaxt ştampları və spiker işarələri olan mətn zəng çatına .txt faylı kimi göndərilir. Hələlik yalnız rus dili.

İstehlakçı Rusiya servisləri arasında Войси fərqlənir — 98% elan edilmiş dəqiqlik, 16 çıxış formatı (stenoqram, görüş protokolu, tapşırıqlar, xülasə, subtitrlər), Telegram, VK və MAX botları — ilk istifadədə 45 pulsuz dəqiqə. Guru Scribe — təsir edici sürət: diarizasiyasız 1 saat audioya 27 saniyə, ₽4/dəq-dən başlayaraq, 60 pulsuz dəqiqə ilə. Teamlogs canlı transkripsiya üçün birbaşa Zoom, Google Meet və Яндекс Телемост-a qoşulur, ₽6/dəq-dən başlayaraq. MyMeet.ai ~96% dəqiqliklə görüş transkripsiyasına fokuslanır və bütün əsas platformalarla inteqrasiya olunur.


Open-source: GigaAM hökm sürür, amma Whisper-in ekosistemi var

Tərtibatçılar üçün open-source landşaft keyfiyyət və qiymət arasında ən yaxşı nisbəti təklif edir. GigaAM v3 (Sber, MIT lisenziyası) — yalnız rus transkripsiyası üçün mütləq lider: durğu işarələmə və mətn normallaşdırması olan end-to-end modellər, rus nitqinin 700 000 saatında öyrədilib. Python API sadədir: gigaam quraşdır, modeli yüklə, transcribe() çağır. Məhdudiyyət — yalnız rus dili, çoxdillilik yoxdur və hələlik GUI-tətbiqlər yoxdur.

Vosk (Apache 2.0 lisenziyası) — oflayn və edge cihazlar üçün ən yaxşı seçim. Rus modeli hətta Raspberry Pi-də 11% WER göstərir — kiçik model cəmi ~50 MB. Python, Java, C#, JavaScript, Go və Rust üçün bağlamalar, üstəlik Android və iOS SDK. Xüsusi güc — audiokitablar və təmiz nitq, burada heyrətamiz 1.2% WER əldə olunur.

Whisper və onun törəmələri ən yaxşı çoxdilli çevikliyi təklif edir. Rus dilinin dəqiqliyi (~16% WER) GigaAM və Vosk-dan az olsa da, 99 dili dəstəkləyir və zəngin alətlər ekosistemi yaradıb. faster-whisper INT8/FP16-da eyni dəqiqliklə ~4x daha sürətli işləyir. whisper.cpp Apple Silicon, x86 və mobil cihazlarda yalnız CPU-da işləməyə imkan verir. WhisperX pyannote-audio vasitəsilə söz-söz vaxt ştampları və diarizasiya əlavə edir. HuggingFace-də rus dilinə fine-tune edilmiş modellər (antony66/whisper-large-v3-russian) WER-i 16.2%-dən ~6.4%-ə endirır.

Texniki olmayan istifadəçilər üçün ən yaxşı masaüstü GUI: Buzz (pulsuz, çoxplatformalı, faster-whisper/whisper.cpp, spikərlərin ayrılması), MacWhisper ($69 Pro həmişəlik, toplu emal, sistem audiosunun yazılması) və Vibe (pulsuz, sadə, GitHub-da ~5 000 ulduz). Hamısı modeli yüklədikdən sonra oflayn işləyir.


Mobil tətbiqlər: iOS və Android üçün ən yaxşı variantlar

iOS platformasında Whisper əsaslı tətbiqlər dominantlıq edir. Aiko (~$5.99, birdəfəlik alış) tamamilə cihazda işləyir — gizlilik vacib olanlar üçün ideal. Whisper Notes ($4.99–6.99, birdəfəlik) kilid ekranından yazma, istifadəçi lüğəti və Apple Silicon-da Whisper Large V3 Turbo əlavə edir. Whisper Transcription (freemium) bulud və on-device rejimləri AI-xülasə ilə təklif edir, reytinq 4.6+. Just Press Record ($4.99) — ən sadə iş axını: Apple Watch-dan bir basma ilə yazma, iCloud vasitəsilə avtomatik transkripsiya.

Android platformasında Voice Notebook (reklamlı pulsuz, Premium) liderdir — rusca diktə üçün ən yaxşı tətbiq, yüklənən dil paketləri ilə oflayn dəstəyi olan Google Speech Recognition, reytinq 4.8/5. Speechnotes (pulsuz, 5M+ yükləmə) — diktəni dayandırmadan durğu işarələmə üçün patentlənmiş klaviatura. SpeechTexter (pulsuz, 80+ dil) — daha sadə alternativ.

Çoxplatformalı: Transkriptor (iOS/Android/Web, sınaq müddəti, sonra ~$4.99/ay) və Notta (iOS/Android/Web, ayda 120 dəq pulsuz, söhbət başına 3 dəq məhdudiyyətlə) — diarizasiya ilə bulud transkripsiyası, lakin Notta-nın rus dilinin keyfiyyəti sual doğurur.

TətbiqPlatformaQiymətOflaynRus dilinin keyfiyyəti
AikoiOS/Mac~$5.99 birdəfəlik100%Yaxşı (Whisper)
Whisper NotesiOS/Mac$4.99–6.99 birdəfəlik100%Yaxşı (Whisper)
Whisper TranscriptioniOS/MacFreemiumiPhone 13+Yaxşı (Whisper)
Voice NotebookAndroidPulsuz/PremiumPaketləYaxşı (Google STT)
SpeechnotesAndroidPulsuz/PremiumMəhdudYaxşı (Google STT)
Just Press RecordiOS~$4.99 birdəfəlikQismənOrta

Masaüstü tətbiqlər: insan siması olan Whisper

Komanda sətri lazım olmayan, sadə GUI istəyən insanlar üçün Whisper əsaslı masaüstü tətbiqlərin bütöv bir ekosistemi böyüyüb. Hamısı oflayn işləyir, məlumatlar kompüterdən çıxmır.

Handy (handy.computer) — macOS/Windows/Linux üçün pulsuz open-source tətbiq, unikal yanaşma ilə: istənilən mətn sahəsinə push-to-talk diktə. Qısayolu basdı, danışdı, buraxdı — mətn aktiv pəncərəyə daxil edildi. Klaviatura əvəzedicisi kimi mətn yığmaq, yazışma və qeydlər üçün ideal. Whisper əsaslı, tam oflayn və gizli.

Vibe (thewh1teagle.github.io/vibe) — GitHub-da 5 000+ ulduzu olan ən yaxşı pulsuz open-source həllərdən biri. Çoxplatformalı (Windows, macOS, Linux), Tauri + whisper.cpp əsasında qurulub. GPU-sürətləndirilmə (NVIDIA, AMD, Apple Silicon), 90+ dil, spiker diarizasiyası, SRT/VTT/TXT/DOCX/PDF ixracı, yt-dlp ilə YouTube-linklərin transkripsiyası, mikrofondan yazma, Claude/Ollama ilə xülasələmə və hətta HTTP API dəstəkləyir. Ən funksional pulsuz masaüstü-klient.

Buzz (buzzcaptions.com) — Whisper üçün daha bir pulsuz open-source GUI. Çoxplatformalı, bir neçə backend dəstəkləyir (whisper.cpp, faster-whisper), spikərlərin ayrılması, subtitrlər ixracı. Vibe-dan daha minimalist, lakin sabit və sınaqdan keçmiş.

MacWhisper / Whisper Transcription (App Store) — pulsuz versiyası (Base və Small modelləri) və Pro-abunəliyi ($8.99/ay və ya $79.99 həmişəlik) olan nativ macOS-tətbiqi. Pro Medium və Large modellərini, toplu emalı, sistem audiosunun yazılmasını (Zoom-zənglər, podkastlar), spikərlərin ayrılmasını və Reader Mode açır. Mac üçün ən cilalanmış Whisper-interfeys.

Whisper Notes (whispernotes.app) — iOS + Mac üçün $6.99 birdəfəlik. 60 000+ istifadəçi. Əsas özəlliyi — system-wide dictation: istənilən tətbiqdə Fn basıb saxladı, danışdı, buraxdı — mətn daxil edildi. Tam oflayn, Apple Silicon-da Whisper Large V3 Turbo istifadə edir.

WhisperDesktop (github.com/Const-me/Whisper) — DirectCompute ilə GPU-sürətləndirilmə olan pulsuz Windows-tətbiqi. Orijinal Whisper-dən sürətli: 3:24 audio GeForce 1080Ti-də 19 saniyədə emal olunur (PyTorch+CUDA-dakı 45 saniyəyə qarşı). Faylların transkripsiyasını və mikrofondan real vaxt yazmağı dəstəkləyir.

WhisperUI (Microsoft Store) — CUDA 11/12 və OpenCL ilə GPU dəstəyi olan pulsuz Windows-tətbiqi. Tam oflayn, SRT/VTT subtitrləri, toplu emal.

Aiko (~$5.99, iOS/Mac) — Apple üçün maksimal sadə Whisper-tətbiqi. Audio faylı sürüklə-burax → mətn. Tam on-device, tənzimləmələr olmadan bir düyməli transkripsiya istəyənlər üçün ideal.


Self-hosted həllər: öz serveriniz üçün

Öz serverində (və ya yerli şəbəkədə) tam funksional transkripsiya servisi yerləşdirmək istəyənlər üçün bir neçə güclü open-source layihə var.

Whishper (github.com/pluja/whishper) — veb-interfeysi olan tam funksional self-hosted platforma. Transkripsiya üçün faster-whisper, subtitrlər tərcüməsi üçün LibreTranslate (60+ dil), daxili subtitrlər redaktoru, JSON/TXT/VTT/SRT ixracı daxildir. Docker Compose ilə yerləşdirilir. Quraşdırıldıqdan sonra 100% oflayn. Buludsuz gizli transkripsiya servisi lazım olan komandalar üçün əla seçim.

WhisperLive (github.com/collabora/WhisperLive) — real vaxt transkripsiyası üçün open-source həll. WebSocket-klientləri olan server kimi işləyir: mikrofon və ya faylı qoşursunuz — minimal gecikmə ilə mətn alırsınız. faster-whisper, TensorRT və OpenVINO backendlərini dəstəkləyir. Görüşlərin və konfransların canlı transkripsiyası üçün uyğundur.

WhisperTranscribe (whispertranscribe.com) — 60 dəqiqə pulsuz sınaq müddəti olan bulud servisi. Whisper + AssemblyAI istifadə edir. Transkripsiyadan başqa, bir yazıdan 57+ məzmun növü yaradır (postlar, xülasələr, marketinq materialları). Masaüstü Windows-tətbiqi. Abunəlik ~$15/ay-dan başlayaraq.


Daxili transkripsiyası olan video redaktorları

Ayrı kateqoriya — audio transkripsiyasını iş axınının bir hissəsi kimi həyata keçirə bilən video redaktorları.

CapCut (ByteDance/TikTok) — güclü Auto Captions funksiyası olan pulsuz video redaktoru. Rus dili daxil olmaqla 100+ dili dəstəkləyir. Nitqi subtitrlərə transkripsiya edir, mətn əsasında video redaktə etməyə imkan verir (transcript-based editing), subtitrləri dillər arasında tərcümə edir. Veb-versiya, masaüstü (Windows/Mac), mobil tətbiqlər. Pulsuz, lakin tam transkripsiyalara deyil, subtitrlərə yönəlib.

Descript — transcript-based editing olan güclü audio/video redaktoru (mətndən sözü silsən — o, videodan kəsilir). Lakin rus dilini dəstəkləmir — yalnız latın əlifbası.

DaVinci Resolve (Blackmagic) — Whisper vasitəsilə daxili transkripsiyası olan peşəkar video redaktoru. Rus dilini dəstəkləyir, lakin keyfiyyət ixtisaslaşmış alətlərdən aşağıdır. Pulsuz versiya əlçatandır.

Subtitle Edit (nikse.dk) — Whisper vasitəsilə inteqrasiya olunmuş transkripsiyası olan Windows üçün pulsuz open-source subtitrlər redaktoru. 7 Whisper-mühərriki (OpenAI, Faster-Whisper, CPP, Const-me, WhisperX və s.), toplu emal, tərcümə, 100+ dil dəstəkləyir. Audiodan subtitrlər yaratmaq üçün ən güclü pulsuz alət.


Brauzer genişləndirmələri və onlayn alətlər

Transkriptor — veb-tətbiq, Chrome/Firefox genişləndirməsi, mobil tətbiq (iOS/Android) kimi əlçatandır. Rus dilini dəstəkləyir, avtomatik diarizasiya, TXT/SRT/DOCX ixracı. Pulsuz sınaq, sonra $9.99–30/ay. 99% dəqiqlik elan edir, lakin rus dili üçün real dəqiqlik aşağıdır.

TurboScribe (turboscribe.ai) — gündə 3 pulsuz transkripsiyası olan veb-servis (hər biri 30 dəqiqəyə qədər). Rus dili dillər siyahısında yüksək dəqiqliklə. Pullu planlar $10/ay-dan başlayaraq limitləri aradan qaldırır. Arxa planda Whisper istifadə edir.

Wonderscribe — tam pulsuz veb-servis, lakin xəta faizi daha yüksək (~16% WER). Dəqiqlik kritik olmadığı zaman qaralama yazılması üçün uyğundur.

HuggingFace Spaces — OpenAI huggingface.co/spaces/openai/whisper saytında pulsuz Whisper-demo yerləşdirib. Faylı yükləyirsiniz, mətn alırsınız. Pulsuz, lakin uzunluq məhdudiyyətləri və növbələrlə.


Niş və dar ixtisaslaşmış alətlər

Vomo (vomo.ai) — AI-transkripsiyası olan səsli qeydlər üçün mobil tətbiq (iOS/Android). Personal productivity-ə yönəlib: fikri yazdı — action items olan strukturlaşdırılmış qeyd aldı. Rus dilini dəstəkləyir.

Subper / SubtitleWhisper (subtitlewhisper.com) — Whisper + Silero VAD əsaslı pulsuz onlayn subtitrlər generatoru. Video məzmun üçün subtitrlərə fokuslanır. Onlayn-redaktoru var. Pulsuz plan məhduddur, pullu $9.99/ay-dan başlayaraq.

Just Press Record ($4.99, iOS) — minimalist Apple tətbiqi: Apple Watch və ya iPhone-dan yazma üçün bir basma, iCloud vasitəsilə avtomatik transkripsiya. Apple Dictation vasitəsilə rus dilini dəstəkləyir. Sürətli səsli qeydlər üçün ideal.

Voice Notebook (Android, reklamlı pulsuz) — rusca diktə üçün ən yaxşı Android-tətbiqi, reytinq 4.8/5. Yüklənən dil paketləri ilə oflayn dəstəyi olan Google Speech Recognition istifadə edir.

Speechnotes (Android, pulsuz, 5M+ yükləmə) — diktəni dayandırmadan durğu işarələmə üçün patentlənmiş klaviatura.


Yekun cədvəl: istifadə ssenarisi üzrə seçim

SsenariƏn yaxşı seçimQiymətRus dili
İstənilən sahəyə sürətli diktəHandy, Whisper NotesPulsuz / $6.99Whisper
Faylların oflayn transkripsiyasıVibe, BuzzPulsuzWhisper
macOS cilalanmış GUIMacWhisper Pro$79.99 həmişəlikWhisper
Windows GPU-sürətləndirilməWhisperDesktop, WhisperUIPulsuzWhisper
Maksimal RU dəqiqliyiGigaChat (audio yüklə)PulsuzGigaAM
Telegram-botVoxbrief (@VidVKYT2AudioBot)PulsuzYouTube, VK
Google Meet/Teams görüşləriDaxili subtitrlərAbunəlik daxilindəBəli
Video üçün subtitrlərSubtitle Edit + WhisperPulsuzWhisper
Video redaktoru + subtitrlərCapCutPulsuzBəli
Self-hosted serverWhishperPulsuzWhisper
Real vaxt transkripsiyasıWhisperLivePulsuzWhisper
İnsan transkripsiyasıGoTranscript$1.20–2.75/dəqAna dili
Enterprise API (RU-optimallaşdırılmış)Yandex SpeechKit~₽0.64/dəq95-97%
Enterprise API (büdcə)Tinkoff VoiceKit~₽0.40/dəq~95%
Rus servisi hamısı-birindəВойси45 dəq pulsuz98%
Mobil tətbiq iOSAiko~$5.99Whisper
Mobil tətbiq AndroidVoice NotebookPulsuzGoogle STT

Nəticə: düzgün aləti necə seçmək

2025–2026-cı illərdə rusca danışan istifadəçilər üçün transkripsiya bazarı artıq ingilis dili ilə keyfiyyət fərqindən əziyyət çəkmir. Əsas nəticə: model arxitekturası brend adından vacibdir — GigaAM əsaslı alətlər rus dili üçün Whisper əsaslı alətlərdən təxminən iki dəfə yaxşı dəqiqlik verir, halbuki əksər beynəlxalq servislər məhz Whisper istifadə edir.

Tənzimləmə olmadan transkripsiya lazım olan adi istifadəçilər üçün GigaChat (pulsuz, veb/Telegram) və Voxbrief (@VidVKYT2AudioBot) (videodan audio çıxarmaq üçün pulsuz Telegram-bot) — ən yaxşı giriş nöqtələridir. Görüşlərin müntəzəm transkripsiyası lazım olan peşəkarlar üçün Google Meet və Microsoft Teams rusca subtitrləri nativ dəstəkləyir, Войси və MyMeet.ai isə görüşlərin AI-protokollarını əlavə edir. Vacib yazılarda maksimal dəqiqlik üçün — GoTranscript insan transkripsiyası (99.4%) və ya ana dili daşıyıcıları ilə Happy Scribe hələ də bənzərsizdir. Tərtibatçılar üçün — GigaAM v3 (MIT, ən yaxşı dəqiqlik) rus dili üçün və ya Speechmatics/AssemblyAI API çoxdilli tapşırıqlar üçün.

Əsas boşluq — Apple ekosistemi: iPhone və Mac-dakı rusca danışan istifadəçilər Voice Memos transkripsiyasını, Live Captions və Apple Intelligence funksiyalarını rus dili üçün istifadə edə bilmir. Apple dil dəstəyini genişləndirənə qədər, Whisper əsaslı tətbiqlər — Aiko və Whisper Notes — tam gizliliklə cihazda tam işləyərək ən yaxşı alternativ olaraq qalır.

FAQ

Rus dili ilə ən yaxşı işləyən nitq tanıma modeli hansıdır?

Sber-in GigaAM2-si Alpha Cephei 2025 benchmarkında 8,4% [WER (Word Error Rate)](/az/blog/word-error-rate-explained) ilə mübahisəsiz liderdir. Müqayisə üçün: [OpenAI Whisper](/az/blog/openai-whisper-guide) Large V3-ü 16,2% WER göstərir — demək olar ki, iki dəfə pis. Vosk 11,0% WER ilə ikinci yerdədir.

Rus dili üçün GigaAM Whisper-dən nə ilə fərqlənir?

GigaAM 700.000 saat rus nitqi ilə öyrədilib və təxminən hər 12 sözdən 1-də səhv edir, Whisper isə hər 6-dan 1-də. GigaAM-in əsas çatışmazlığı yalnız rus dilini dəstəkləməsidir, Whisper isə 99 dildə işləyir və zəngin GUI tətbiq ekosisteminə malikdir.

Rusca transkripsiya üçün ən ucuz korporativ API hansıdır?

Rus xidmətləri arasında ən ucuzu ~₽0,40/dəq qiymətlə və ~95% dəqiqliklə Tinkoff VoiceKit-dir. Yandex SpeechKit ~₽0,64/dəq qiymətlə 95–97% dəqiqlik təqdim edir. Beynəlxalq seçimlər arasında Deepgram (~$0,46/saat) və AssemblyAI ($0,15–0,27/saat) var.

Süni intellekt əvəzinə insan transkripsiyası sifariş etməyə dəyərmi?

Kritik əhəmiyyətli yazılar üçün — bəli. GoTranscript rusca ana dili daşıyıcıları ilə $1,20–2,75/dəq qiymətə 99,4% dəqiqlik təmin edir. Süni intellekt transkripsiyası (8–16% WER) əksər tapşırıqlar üçün uyğundur, lakin hüquqi sənədlər, tibbi qeydlər və nəşrlər üçün insan transkripsiyası daha etibarlıdır.

Rus dili ilə işləyən hansı pulsuz transkripsiya alətləri var?

Sber-in GigaChat-i quraşdırma tələb etməyən ən yaxşı pulsuz seçimdir (veb, Telegram, diarizasiyalı 2 saata qədər fayllar). Oflayn iş üçün — Vibe və Buzz (Whisper əsaslı pulsuz masaüstü GUI-lər). Onlayn: TurboScribe (gündə 3 fayl, 30 dəq) və Any2Text.ru (qeydiyyatsız 15 dəqiqə).