MDB bazarı üçün transkripsiya: tətbiqlər və alətlər
Nitq transkripsiyası üçün tətbiqlər və alətlərə tam icmal: Whisper əsaslı masaüstü GUI, self-hosted həllər, daxili transkripsiyası olan video redaktorları, brauzer servisləri və iOS və Android üçün mobil tətbiqlər. Bütün variantlar — tamamilə pulsuz open-source-dan genişləndirilmiş imkanlara malik ödənişli versiyalara qədər.
Masaüstü tətbiqlər: insan üzlü Whisper
Əmr sətri olmadan sadə GUI lazım olanlara Whisper əsaslı masaüstü tətbiqlərin bütöv bir ekosistemi yaranıb. Hamısı oflayn işləyir, məlumatlar kompüterdən kənara çıxmır — bu barədə ətraflı «Yerli və Bulud Transkripsiyası» məqaləsində oxuyun.
Handy (handy.computer) — macOS/Windows/Linux üçün unikal yanaşması olan pulsuz open-source tətbiq: istənilən mətn sahəsinə push-to-talk diktə. Qısa düyməni basıb → deyib → buraxıb → mətn aktiv pəncərəyə daxil edilir. Mətn yığımı, yazışma və qeydlər zamanı klaviaturanı əvəz etmək üçün ideal. Whisper üzərində qurulub, tamamilə oflayn və məxfi. Wordcab və Bolt AI tərəfindən sponsorluq edilir.
Vibe (thewh1teagle.github.io/vibe) — GitHub-da 5 000+ ulduzla ən yaxşı pulsuz open-source həllərdən biri. Kross-platformlu (Windows, macOS, Linux), Tauri + whisper.cpp üzərində qurulub. GPU sürətləndirməsi (NVIDIA, AMD, Apple Silicon — Vulkan/CoreML vasitəsilə), 90+ dil, spiker diarizasiyası, SRT/VTT/TXT/DOCX/PDF/JSON formatlarına ixrac, yt-dlp vasitəsilə YouTube linklərinin transkripsiyası, mikrofondan yazma, Claude/Ollama vasitəsilə xülasələmə, Swagger sənədləşdirilməsi olan HTTP API və hətta CLI rejimi dəstəklənir. Hal-hazırda ən funksional pulsuz masaüstü klient. Quraşdırıcı ~24 MB, quraşdırmadan sonra ~87 MB + model.
Buzz (buzzcaptions.com) — Whisper üçün pulsuz open-source GUI. Kross-platformlu, bir neçə backend (whisper.cpp, faster-whisper), spiker ayırma, altyazı ixracını dəstəkləyir. Vibe-dan daha minimalist, lakin sabit və sınanmış.
MacWhisper / Whisper Transcription (App Store, macupdate.com) — nativ macOS tətbiqi. Pulsuz versiya Base və Small modellərini əhatə edir. Pro abunəlik: $4.99/həftə, $8.99/ay, $29.99/il və ya $79.99 həmişəlik. Pro — Medium və Large modellərini, toplu emal, sistem audio yazımını (Zoom zəngləri, podkastlar), spiker ayırmanı, Reader Mode, xülasələmə üçün ChatGPT inteqrasiyasını açır. Mac üçün ən cilalanmış Whisper interfeysi. MacUpdate reytinqi ~4.0.
Whisper Notes (whispernotes.app) — iOS + Mac üçün $6.99 birdəfəlik. 60 000+ istifadəçi. Əsas xüsusiyyət — system-wide dictation: istənilən tətbiqdə Fn düyməsini basıb saxlayıb → deyib → buraxıb → mətn daxil edilir. Audio/video fayllarını axın nəticəsi ilə import etmək. Tamamilə oflayn, Apple Silicon-da Whisper Large V3 Turbo istifadə edir.
WhisperDesktop (github.com/Const-me/Whisper) — DirectCompute/GPGPU vasitəsilə GPU sürətləndirməsi olan pulsuz Windows tətbiqi. Orijinal Whisper-dən xeyli sürətli: GeForce 1080Ti-də 3:24 dəq audio 19 saniyədə (PyTorch+CUDA-nın 45 saniyəsinə qarşı). Faylların transkripsiyası + mikrofondan real vaxtda yazma. Tövsiyə olunan model: ggml-medium.bin (~1.42 QB).
WhisperUI (Microsoft Store) — pulsuz Windows tətbiqi. CPU, OpenCL, NVIDIA CUDA 11/12 vasitəsilə GPU sürətləndirməsi. Tamamilə oflayn, SRT/VTT formatlarında altyazı ixracı, toplu emal.
Aiko (~$5.99, iOS/Mac) — Apple üçün maksimal sadə Whisper tətbiqi. Audio faylı sürükləyib burax → mətn. 100% cihazda, parametrsiz bir düymə ilə transkripsiya istəyənlər üçün ideal.
Whisper Transcription (iOS App Store, freemium) — cihazda və bulud rejimi olan mobil tətbiq. Share Extension — iMessage, WhatsApp, Voice Memos-dan səsli mesajları transkripsiya etməyə imkan verir. Cihazda işləmək üçün iPhone 13+ tələb olunur. AI xülasələmə, transkriplə söhbət. Reytinq 4.6+.
Self-hosted həllər: öz serveriniz üçün
Öz serverində və ya lokal şəbəkədə tam funksional transkripsiya xidməti qurmaq istəyənlər üçün.
Whishper (github.com/pluja/whishper) — veb-interfeysi olan tam funksional self-hosted platforma. Transkripsiya üçün faster-whisper, altyazı tərcüməsi üçün LibreTranslate/Argos Translate (60+ dil), daxili altyazı redaktoru, JSON/TXT/VTT/SRT formatlarına ixrac daxildir. Docker Compose vasitəsilə yerləşdirilir (5 konteyner: API, backend, frontend, tərcümə, MongoDB). Quraşdırmadan sonra 100% oflayn. Buludsuz məxfi xidmət lazım olan komandalar üçün əla seçim.
WhisperLive (github.com/collabora/WhisperLive, Collabora) — real vaxtda transkripsiya üçün open-source həll. WebSocket-server: mikrofon və ya fayl qoşub → mətni minimal gecikmə ilə alırsınız. faster-whisper, TensorRT və OpenVINO backendlərini dəstəkləyir. Python-klient və JS-demo. Görüşlərin və konfransların canlı transkripsiyası üçün uyğundur.
WhisperTranscribe (whispertranscribe.com) — Windows üçün masaüstü tətbiqi olan bulud xidməti. Kart daxil etmədən 60 dəqiqəlik pulsuz sınaq. Whisper + AssemblyAI istifadə edir. Transkripsiyadan əlavə: bir yazıdan 57+ məzmun növü (postlar, xülasələr, marketinq materialları), istifadəçi üslubuna AI-öyrətmə, YouTube/Vimeo linkləri ilə transkripsiya, 2.5 mln kitabxanasından podkastlar. 55+ dil. Abunəlik ~$15/ay.
Daxili transkripsiyası olan video redaktorlar
Ayrıca kateqoriya — iş prosesinin bir hissəsi kimi audionu transkripsiya edə bilən video redaktorları.
CapCut (ByteDance/TikTok) — güclü Auto Captions funksiyası olan pulsuz video redaktor. Azərbaycan dili daxil 100+ dili dəstəkləyir. Nitqi altyazıya transkripsiya edir, mətn əsasında video redaktə etməyə (transcript-based editing), altyazıları tərcümə etməyə, iki dilli altyazılar yaratmağa imkan verir. Veb-versiya, masaüstü (Windows/Mac), mobil tətbiqlər. Pulsuz. Məhdudiyyət: altyazılara yönəlib, tam transkripsiya sənədlərinə deyil.
Descript — transcript-based editing ilə güclü audio/video redaktor (mətndən sözü silsən → o, videodan kəsilir). Rus dilini dəstəkləmir — yalnız latın. Tam mənzərə üçün qeyd edirik.
DaVinci Resolve (Blackmagic Design) — Whisper vasitəsilə daxili transkripsiyası olan peşəkar video redaktor. Rus dilini dəstəkləyir, lakin keyfiyyət ixtisaslaşmış alətlərdən aşağıdır. Pulsuz versiya mövcuddur. Text-based editing üçün taymlaynda transkripsiya.
Subtitle Edit (nikse.dk) — Whisper vasitəsilə inteqrasiya edilmiş transkripsiyası olan Windows üçün (qismən Linux) pulsuz open-source altyazı redaktoru. 7+ Whisper mühərrikini (OpenAI Whisper, Purfview's Faster-Whisper-XXL, CPP, CPP cuBLAS, Const-me, CTranslate2, stable-ts, WhisperX), toplu emalı, avtotərcüməni, 100+ dili dəstəkləyir. Audiodan altyazı yaratmaq üçün ən güclü pulsuz alət. RTX A6000-da — 2 saat bir neçə dəqiqədə.
Subper / SubtitleWhisper (subtitlewhisper.com) — Whisper + Silero VAD əsaslı onlayn altyazı generatoru. Onlayn altyazı redaktoru. Pulsuz plan məhduddur, ödənişli $9.99/ay-dan. Durğu işarələri və abzas üçün GPT inteqrasiyası.
Brauzer genişləndirmələri və onlayn alətlər
Transkriptor — veb-tətbiq + Chrome/Firefox genişləndirməsi + iOS/Android. Rus dilini dəstəkləyir, avtomatik diarizasiya, TXT/SRT/DOCX formatlarına ixrac. Pulsuz sınaq, sonra $9.99–30/ay. 99% dəqiqlik iddia edir (rus dili üçün real göstərici aşağıdır).
TurboScribe (turboscribe.ai) — gündə 3 pulsuz transkripsiya olan veb-xidmət (hər biri 30 dəqiqəyə qədər). Rus dili dillər siyahısında «Excellent Accuracy» səviyyəsindədir. Ödənişli planlar ~$10/ay-dan. Arxasında Whisper dayanır.
Wonderscribe — tamamilə pulsuz veb-xidmət, lakin səhv faizi yüksəkdir (~16% WER). Qaralama transkripsiya üçün.
HuggingFace Spaces (huggingface.co/spaces/openai/whisper) — OpenAI-dən pulsuz Whisper-demo. Faylı yükləyib → mətn alırsınız. Pulsuz, lakin məhdudiyyətləri və növbələri var.
Speech2Text.ru — rus xidməti, spiker diarizasiyası ilə 3 pulsuz saat.
Any2Text.ru — rus xidməti, qeydiyyatsız 15 dəqiqə + qeydiyyat zamanı 60 dəqiqə. VKontakte-dən link ilə video transkripsiyasını dəstəkləyir.
Mobil tətbiqlər
iOS
| Tətbiq | Qiymət | Oflayn | Xüsusiyyət |
|---|---|---|---|
| Aiko | ~$5.99 birdəfəlik | 100% | Ən sadə drag-and-drop |
| Whisper Notes | $6.99 birdəfəlik | 100% | Fn vasitəsilə sistem diktəsi |
| Whisper Transcription | Freemium (abunəlik) | iPhone 13+ | AI xülasələmə, transkriplə söhbət |
| Just Press Record | ~$4.99 | Qismən | Bir toxunuş, Apple Watch, iCloud sync |
| Whisper: Speech to Text | Freemium | Dəyişir | Yazma+transkripsiya üçün sadə interfeys |
Android
| Tətbiq | Qiymət | Oflayn | Xüsusiyyət |
|---|---|---|---|
| Voice Notebook | Pulsuz + Premium | Dil paketi ilə | Ən yaxşı rus diktəsi, reytinq 4.8 |
| Speechnotes | Pulsuz, 5M+ yükləmə | Məhdud | Patentli durğu işarələri klaviaturası |
| SpeechTexter | Pulsuz, 80+ dil | Xeyr | Əsas voice-to-text |
| Notely Voice | Pulsuz, reklamsız | Bəli | Uzun qeydlər üçün smartfonda Whisper |
Kross-platformlu
| Tətbiq | Platformalar | Qiymət | Rus dili |
|---|---|---|---|
| Transkriptor | iOS/Android/Web/Chrome/Firefox | $9.99–30/ay | Bəli |
| Notta | iOS/Android/Web | Pulsuz 120 dəq/ay (3 dəq/söhbət) | Mübahisəli keyfiyyət |
| Vomo | iOS/Android | Freemium | Səsli qeydlər + AI |
Yekun cədvəl: istifadə ssenarisi üzrə seçim
| Ssenari | Ən yaxşı seçim | Qiymət | Rus dili |
|---|---|---|---|
| İstənilən sahəyə sürətli diktə | Handy, Whisper Notes | Pulsuz / $6.99 | Whisper |
| Faylların oflayn transkripsiyası | Vibe, Buzz | Pulsuz | Whisper |
| macOS cilalanmış GUI | MacWhisper Pro | $79.99 həmişəlik | Whisper |
| Windows GPU sürətləndirmə | WhisperDesktop, WhisperUI | Pulsuz | Whisper |
| Maksimum RU dəqiqliyi | GigaChat (audio yüklə) | Pulsuz | GigaAM |
| Telegram-bot | Voxbrief (@VidVKYT2AudioBot) | Pulsuz | YouTube, VK |
| Google Meet/Teams görüşləri | Daxili altyazılar | Abunəlik daxilində | Bəli |
| Video üçün altyazılar | Subtitle Edit + Whisper | Pulsuz | Whisper |
| Video redaktor + altyazılar | CapCut | Pulsuz | Bəli |
| Self-hosted server | Whishper | Pulsuz | Whisper |
| Real vaxt (live) | WhisperLive | Pulsuz | Whisper |
| İnsan transkripsiyası | GoTranscript | $1.20–2.75/dəq | Daşıyıcılar |
| Enterprise API (RU-optimallaşdırılmış) | Yandex SpeechKit | ~₽0.64/dəq | 95-97% |
| Enterprise API (büdcəli) | Tinkoff VoiceKit | ~₽0.40/dəq | ~95% |
| Rus xidməti hamısı-bir-yerdə | Войси | 45 dəq pulsuz | 98% |
| Mobil iOS | Aiko | ~$5.99 | Whisper |
| Mobil Android | Voice Notebook | Pulsuz | Google STT |
| Yazılardan məzmun | WhisperTranscribe | ~$15/ay | 57+ format |
| Qeydiyyatsız rus veb | Any2Text.ru | 15 dəq pulsuz | Bəli |
FAQ
Transkripsiya üçün ən yaxşı pulsuz tətbiq hansıdır?
Masaüstü üçün ən yaxşı pulsuz seçimlər Vibe və Buzz-dır — hər ikisi Whisper əsaslıdır və tamamilə oflayn işləyir. Quraşdırma tələb etməyən onlayn transkripsiya üçün TurboScribe (gündə 3 fayl, 30 dəqiqəyə qədər pulsuz) və Sber-in GigaChat-ini (2 saata qədər audio yükləmə, diarizasiya və xülasə) sınayın.
İnternetsiz audionu oflayn transkripsiya etmək mümkündürmü?
Bəli. Whisper əsaslı bütün masaüstü tətbiqlər (Vibe, Buzz, MacWhisper, WhisperDesktop) model yükləndikdən sonra tamamilə oflayn işləyir. Məlumatlarınız kompüterdən çıxmır, bu da tam məxfilik təmin edir.
Hansı tətbiqlər rus dilini ən yaxşı tanıyır?
Rus dili üçün ən yüksək dəqiqliyi Sber-in GigaAM-i təmin edir (8,4% WER). Pulsuz istehlakçı alətləri arasında GigaChat (audio yükləmə) və Yandex SpeechKit (korporativ API, 95–97% dəqiqlik) seçilir. Whisper əsaslı tətbiqlər məqbul keyfiyyət təqdim edir (rus dili üçün ~84% dəqiqlik).
Telefonda transkripsiya üçün hansı mobil tətbiqi seçməliyəm?
iOS-da ən yaxşı seçimlər Aiko (~5,99 $, tamamilə oflayn) və Whisper Notes-dur (6,99 $, sistem səviyyəsində diktə). Android-də Voice Notebook liderdir (pulsuz, reytinq 4,8, Google STT ilə ən yaxşı rus diktəsi).
Öz transkripsiya serverimi necə qurmalıyam?
Ən yaxşı self-hosted seçim Whishper-dir: veb interfeysi olan tam funksional platforma, Docker Compose ilə qurulur, faster-whisper ilə transkripsiya, altyazı tərcüməsi və daxili redaktor daxildir. Real vaxt transkripsiyası üçün Collabora-nın WhisperLive-ını sınayın.