Bütün məqalələr

MDB bazarı üçün transkripsiya: tətbiqlər və alətlər

·18 dəq oxuma

Nitq transkripsiyası üçün tətbiqlər və alətlərə tam icmal: Whisper əsaslı masaüstü GUI, self-hosted həllər, daxili transkripsiyası olan video redaktorları, brauzer servisləri və iOS və Android üçün mobil tətbiqlər. Bütün variantlar — tamamilə pulsuz open-source-dan genişləndirilmiş imkanlara malik ödənişli versiyalara qədər.


Masaüstü tətbiqlər: insan üzlü Whisper

Əmr sətri olmadan sadə GUI lazım olanlara Whisper əsaslı masaüstü tətbiqlərin bütöv bir ekosistemi yaranıb. Hamısı oflayn işləyir, məlumatlar kompüterdən kənara çıxmır — bu barədə ətraflı «Yerli və Bulud Transkripsiyası» məqaləsində oxuyun.

Handy (handy.computer) — macOS/Windows/Linux üçün unikal yanaşması olan pulsuz open-source tətbiq: istənilən mətn sahəsinə push-to-talk diktə. Qısa düyməni basıb → deyib → buraxıb → mətn aktiv pəncərəyə daxil edilir. Mətn yığımı, yazışma və qeydlər zamanı klaviaturanı əvəz etmək üçün ideal. Whisper üzərində qurulub, tamamilə oflayn və məxfi. Wordcab və Bolt AI tərəfindən sponsorluq edilir.

Vibe (thewh1teagle.github.io/vibe) — GitHub-da 5 000+ ulduzla ən yaxşı pulsuz open-source həllərdən biri. Kross-platformlu (Windows, macOS, Linux), Tauri + whisper.cpp üzərində qurulub. GPU sürətləndirməsi (NVIDIA, AMD, Apple Silicon — Vulkan/CoreML vasitəsilə), 90+ dil, spiker diarizasiyası, SRT/VTT/TXT/DOCX/PDF/JSON formatlarına ixrac, yt-dlp vasitəsilə YouTube linklərinin transkripsiyası, mikrofondan yazma, Claude/Ollama vasitəsilə xülasələmə, Swagger sənədləşdirilməsi olan HTTP API və hətta CLI rejimi dəstəklənir. Hal-hazırda ən funksional pulsuz masaüstü klient. Quraşdırıcı ~24 MB, quraşdırmadan sonra ~87 MB + model.

Buzz (buzzcaptions.com) — Whisper üçün pulsuz open-source GUI. Kross-platformlu, bir neçə backend (whisper.cpp, faster-whisper), spiker ayırma, altyazı ixracını dəstəkləyir. Vibe-dan daha minimalist, lakin sabit və sınanmış.

MacWhisper / Whisper Transcription (App Store, macupdate.com) — nativ macOS tətbiqi. Pulsuz versiya Base və Small modellərini əhatə edir. Pro abunəlik: $4.99/həftə, $8.99/ay, $29.99/il və ya $79.99 həmişəlik. Pro — Medium və Large modellərini, toplu emal, sistem audio yazımını (Zoom zəngləri, podkastlar), spiker ayırmanı, Reader Mode, xülasələmə üçün ChatGPT inteqrasiyasını açır. Mac üçün ən cilalanmış Whisper interfeysi. MacUpdate reytinqi ~4.0.

Whisper Notes (whispernotes.app) — iOS + Mac üçün $6.99 birdəfəlik. 60 000+ istifadəçi. Əsas xüsusiyyət — system-wide dictation: istənilən tətbiqdə Fn düyməsini basıb saxlayıb → deyib → buraxıb → mətn daxil edilir. Audio/video fayllarını axın nəticəsi ilə import etmək. Tamamilə oflayn, Apple Silicon-da Whisper Large V3 Turbo istifadə edir.

WhisperDesktop (github.com/Const-me/Whisper) — DirectCompute/GPGPU vasitəsilə GPU sürətləndirməsi olan pulsuz Windows tətbiqi. Orijinal Whisper-dən xeyli sürətli: GeForce 1080Ti-də 3:24 dəq audio 19 saniyədə (PyTorch+CUDA-nın 45 saniyəsinə qarşı). Faylların transkripsiyası + mikrofondan real vaxtda yazma. Tövsiyə olunan model: ggml-medium.bin (~1.42 QB).

WhisperUI (Microsoft Store) — pulsuz Windows tətbiqi. CPU, OpenCL, NVIDIA CUDA 11/12 vasitəsilə GPU sürətləndirməsi. Tamamilə oflayn, SRT/VTT formatlarında altyazı ixracı, toplu emal.

Aiko (~$5.99, iOS/Mac) — Apple üçün maksimal sadə Whisper tətbiqi. Audio faylı sürükləyib burax → mətn. 100% cihazda, parametrsiz bir düymə ilə transkripsiya istəyənlər üçün ideal.

Whisper Transcription (iOS App Store, freemium) — cihazda və bulud rejimi olan mobil tətbiq. Share Extension — iMessage, WhatsApp, Voice Memos-dan səsli mesajları transkripsiya etməyə imkan verir. Cihazda işləmək üçün iPhone 13+ tələb olunur. AI xülasələmə, transkriplə söhbət. Reytinq 4.6+.


Self-hosted həllər: öz serveriniz üçün

Öz serverində və ya lokal şəbəkədə tam funksional transkripsiya xidməti qurmaq istəyənlər üçün.

Whishper (github.com/pluja/whishper) — veb-interfeysi olan tam funksional self-hosted platforma. Transkripsiya üçün faster-whisper, altyazı tərcüməsi üçün LibreTranslate/Argos Translate (60+ dil), daxili altyazı redaktoru, JSON/TXT/VTT/SRT formatlarına ixrac daxildir. Docker Compose vasitəsilə yerləşdirilir (5 konteyner: API, backend, frontend, tərcümə, MongoDB). Quraşdırmadan sonra 100% oflayn. Buludsuz məxfi xidmət lazım olan komandalar üçün əla seçim.

WhisperLive (github.com/collabora/WhisperLive, Collabora) — real vaxtda transkripsiya üçün open-source həll. WebSocket-server: mikrofon və ya fayl qoşub → mətni minimal gecikmə ilə alırsınız. faster-whisper, TensorRT və OpenVINO backendlərini dəstəkləyir. Python-klient və JS-demo. Görüşlərin və konfransların canlı transkripsiyası üçün uyğundur.

WhisperTranscribe (whispertranscribe.com) — Windows üçün masaüstü tətbiqi olan bulud xidməti. Kart daxil etmədən 60 dəqiqəlik pulsuz sınaq. Whisper + AssemblyAI istifadə edir. Transkripsiyadan əlavə: bir yazıdan 57+ məzmun növü (postlar, xülasələr, marketinq materialları), istifadəçi üslubuna AI-öyrətmə, YouTube/Vimeo linkləri ilə transkripsiya, 2.5 mln kitabxanasından podkastlar. 55+ dil. Abunəlik ~$15/ay.


Daxili transkripsiyası olan video redaktorlar

Ayrıca kateqoriya — iş prosesinin bir hissəsi kimi audionu transkripsiya edə bilən video redaktorları.

CapCut (ByteDance/TikTok) — güclü Auto Captions funksiyası olan pulsuz video redaktor. Azərbaycan dili daxil 100+ dili dəstəkləyir. Nitqi altyazıya transkripsiya edir, mətn əsasında video redaktə etməyə (transcript-based editing), altyazıları tərcümə etməyə, iki dilli altyazılar yaratmağa imkan verir. Veb-versiya, masaüstü (Windows/Mac), mobil tətbiqlər. Pulsuz. Məhdudiyyət: altyazılara yönəlib, tam transkripsiya sənədlərinə deyil.

Descript — transcript-based editing ilə güclü audio/video redaktor (mətndən sözü silsən → o, videodan kəsilir). Rus dilini dəstəkləmir — yalnız latın. Tam mənzərə üçün qeyd edirik.

DaVinci Resolve (Blackmagic Design) — Whisper vasitəsilə daxili transkripsiyası olan peşəkar video redaktor. Rus dilini dəstəkləyir, lakin keyfiyyət ixtisaslaşmış alətlərdən aşağıdır. Pulsuz versiya mövcuddur. Text-based editing üçün taymlaynda transkripsiya.

Subtitle Edit (nikse.dk) — Whisper vasitəsilə inteqrasiya edilmiş transkripsiyası olan Windows üçün (qismən Linux) pulsuz open-source altyazı redaktoru. 7+ Whisper mühərrikini (OpenAI Whisper, Purfview's Faster-Whisper-XXL, CPP, CPP cuBLAS, Const-me, CTranslate2, stable-ts, WhisperX), toplu emalı, avtotərcüməni, 100+ dili dəstəkləyir. Audiodan altyazı yaratmaq üçün ən güclü pulsuz alət. RTX A6000-da — 2 saat bir neçə dəqiqədə.

Subper / SubtitleWhisper (subtitlewhisper.com) — Whisper + Silero VAD əsaslı onlayn altyazı generatoru. Onlayn altyazı redaktoru. Pulsuz plan məhduddur, ödənişli $9.99/ay-dan. Durğu işarələri və abzas üçün GPT inteqrasiyası.


Brauzer genişləndirmələri və onlayn alətlər

Transkriptor — veb-tətbiq + Chrome/Firefox genişləndirməsi + iOS/Android. Rus dilini dəstəkləyir, avtomatik diarizasiya, TXT/SRT/DOCX formatlarına ixrac. Pulsuz sınaq, sonra $9.99–30/ay. 99% dəqiqlik iddia edir (rus dili üçün real göstərici aşağıdır).

TurboScribe (turboscribe.ai) — gündə 3 pulsuz transkripsiya olan veb-xidmət (hər biri 30 dəqiqəyə qədər). Rus dili dillər siyahısında «Excellent Accuracy» səviyyəsindədir. Ödənişli planlar ~$10/ay-dan. Arxasında Whisper dayanır.

Wonderscribe — tamamilə pulsuz veb-xidmət, lakin səhv faizi yüksəkdir (~16% WER). Qaralama transkripsiya üçün.

HuggingFace Spaces (huggingface.co/spaces/openai/whisper) — OpenAI-dən pulsuz Whisper-demo. Faylı yükləyib → mətn alırsınız. Pulsuz, lakin məhdudiyyətləri və növbələri var.

Speech2Text.ru — rus xidməti, spiker diarizasiyası ilə 3 pulsuz saat.

Any2Text.ru — rus xidməti, qeydiyyatsız 15 dəqiqə + qeydiyyat zamanı 60 dəqiqə. VKontakte-dən link ilə video transkripsiyasını dəstəkləyir.


Mobil tətbiqlər

iOS

TətbiqQiymətOflaynXüsusiyyət
Aiko~$5.99 birdəfəlik100%Ən sadə drag-and-drop
Whisper Notes$6.99 birdəfəlik100%Fn vasitəsilə sistem diktəsi
Whisper TranscriptionFreemium (abunəlik)iPhone 13+AI xülasələmə, transkriplə söhbət
Just Press Record~$4.99QismənBir toxunuş, Apple Watch, iCloud sync
Whisper: Speech to TextFreemiumDəyişirYazma+transkripsiya üçün sadə interfeys

Android

TətbiqQiymətOflaynXüsusiyyət
Voice NotebookPulsuz + PremiumDil paketi iləƏn yaxşı rus diktəsi, reytinq 4.8
SpeechnotesPulsuz, 5M+ yükləməMəhdudPatentli durğu işarələri klaviaturası
SpeechTexterPulsuz, 80+ dilXeyrƏsas voice-to-text
Notely VoicePulsuz, reklamsızBəliUzun qeydlər üçün smartfonda Whisper

Kross-platformlu

TətbiqPlatformalarQiymətRus dili
TranskriptoriOS/Android/Web/Chrome/Firefox$9.99–30/ayBəli
NottaiOS/Android/WebPulsuz 120 dəq/ay (3 dəq/söhbət)Mübahisəli keyfiyyət
VomoiOS/AndroidFreemiumSəsli qeydlər + AI

Yekun cədvəl: istifadə ssenarisi üzrə seçim

SsenariƏn yaxşı seçimQiymətRus dili
İstənilən sahəyə sürətli diktəHandy, Whisper NotesPulsuz / $6.99Whisper
Faylların oflayn transkripsiyasıVibe, BuzzPulsuzWhisper
macOS cilalanmış GUIMacWhisper Pro$79.99 həmişəlikWhisper
Windows GPU sürətləndirməWhisperDesktop, WhisperUIPulsuzWhisper
Maksimum RU dəqiqliyiGigaChat (audio yüklə)PulsuzGigaAM
Telegram-botVoxbrief (@VidVKYT2AudioBot)PulsuzYouTube, VK
Google Meet/Teams görüşləriDaxili altyazılarAbunəlik daxilindəBəli
Video üçün altyazılarSubtitle Edit + WhisperPulsuzWhisper
Video redaktor + altyazılarCapCutPulsuzBəli
Self-hosted serverWhishperPulsuzWhisper
Real vaxt (live)WhisperLivePulsuzWhisper
İnsan transkripsiyasıGoTranscript$1.20–2.75/dəqDaşıyıcılar
Enterprise API (RU-optimallaşdırılmış)Yandex SpeechKit~₽0.64/dəq95-97%
Enterprise API (büdcəli)Tinkoff VoiceKit~₽0.40/dəq~95%
Rus xidməti hamısı-bir-yerdəВойси45 dəq pulsuz98%
Mobil iOSAiko~$5.99Whisper
Mobil AndroidVoice NotebookPulsuzGoogle STT
Yazılardan məzmunWhisperTranscribe~$15/ay57+ format
Qeydiyyatsız rus vebAny2Text.ru15 dəq pulsuzBəli

FAQ

Transkripsiya üçün ən yaxşı pulsuz tətbiq hansıdır?

Masaüstü üçün ən yaxşı pulsuz seçimlər Vibe və Buzz-dır — hər ikisi Whisper əsaslıdır və tamamilə oflayn işləyir. Quraşdırma tələb etməyən onlayn transkripsiya üçün TurboScribe (gündə 3 fayl, 30 dəqiqəyə qədər pulsuz) və Sber-in GigaChat-ini (2 saata qədər audio yükləmə, diarizasiya və xülasə) sınayın.

İnternetsiz audionu oflayn transkripsiya etmək mümkündürmü?

Bəli. Whisper əsaslı bütün masaüstü tətbiqlər (Vibe, Buzz, MacWhisper, WhisperDesktop) model yükləndikdən sonra tamamilə oflayn işləyir. Məlumatlarınız kompüterdən çıxmır, bu da tam məxfilik təmin edir.

Hansı tətbiqlər rus dilini ən yaxşı tanıyır?

Rus dili üçün ən yüksək dəqiqliyi Sber-in GigaAM-i təmin edir (8,4% WER). Pulsuz istehlakçı alətləri arasında GigaChat (audio yükləmə) və Yandex SpeechKit (korporativ API, 95–97% dəqiqlik) seçilir. Whisper əsaslı tətbiqlər məqbul keyfiyyət təqdim edir (rus dili üçün ~84% dəqiqlik).

Telefonda transkripsiya üçün hansı mobil tətbiqi seçməliyəm?

iOS-da ən yaxşı seçimlər Aiko (~5,99 $, tamamilə oflayn) və Whisper Notes-dur (6,99 $, sistem səviyyəsində diktə). Android-də Voice Notebook liderdir (pulsuz, reytinq 4,8, Google STT ilə ən yaxşı rus diktəsi).

Öz transkripsiya serverimi necə qurmalıyam?

Ən yaxşı self-hosted seçim Whishper-dir: veb interfeysi olan tam funksional platforma, Docker Compose ilə qurulur, faster-whisper ilə transkripsiya, altyazı tərcüməsi və daxili redaktor daxildir. Real vaxt transkripsiyası üçün Collabora-nın WhisperLive-ını sınayın.