Усе артыкулы

Транскрыбацыя для СНД-рынку: прыкладанні і інструменты

·18 хв чытання

Поўны агляд прыкладанняў і інструментаў для транскрыбацыі маўлення: дэсктопныя GUI на базе Whisper, self-hosted рашэнні, відэарэдактары з убудаванай транскрыбацыяй, браўзерныя сэрвісы і мабільныя прыкладанні для iOS і Android. Усе варыянты — ад цалкам бясплатных open-source да платных з пашыранымі магчымасцямі.


Дэсктопныя прыкладанні: Whisper з чалавечым тварам

Для тых, каму патрэбен просты GUI без каманднага радка, вырасла цэлая экасістэма дэсктопных прыкладанняў на базе Whisper. Усе яны працуюць афлайн, даныя не пакідаюць камп'ютар — падрабязней пра гэта ў артыкуле «Лакальная vs воблачная транскрыбацыя».

Handy (handy.computer) — бясплатнае open-source прыкладанне для macOS/Windows/Linux з унікальным падыходам: push-to-talk дыктоўка проста ў любое тэкставае поле. Націснуў хоткей → сказаў → адпусціў → тэкст устаўлены ў актыўнае акно. Ідэальна для замены клавіятуры пры наборы тэксту, перапісцы і нататках. Пабудавана на Whisper, цалкам афлайн і прыватна. Спансіруецца Wordcab і Bolt AI.

Vibe (thewh1teagle.github.io/vibe) — адно з лепшых бясплатных open-source рашэнняў, 5 000+ зорак на GitHub. Кросплатформны (Windows, macOS, Linux), пабудаваны на Tauri + whisper.cpp. Падтрымлівае GPU-паскарэнне (NVIDIA, AMD, Apple Silicon праз Vulkan/CoreML), 90+ моў, дыярызацыю спікераў, экспарт у SRT/VTT/TXT/DOCX/PDF/JSON, транскрыбацыю YouTube-спасылак праз yt-dlp, запіс з мікрафона, суммарызацыю праз Claude/Ollama, HTTP API з Swagger-дакументацыяй і нават CLI-рэжым. Самы функцыянальны бясплатны дэсктоп-кліент на цяперашні момант. Усталёўшчык ~24 МБ, пасля ўсталявання ~87 МБ + мадэль.

Buzz (buzzcaptions.com) — бясплатны open-source GUI для Whisper. Кросплатформны, падтрымлівае некалькі бэкендаў (whisper.cpp, faster-whisper), падзяленне спікераў, экспарт субтытраў. Больш мінімалістычны, чым Vibe, але стабільны і правераны.

MacWhisper / Whisper Transcription (App Store, macupdate.com) — натыўнае macOS-прыкладанне. Бясплатная версія ўключае мадэлі Base і Small. Pro-падпіска: $4.99/тыд, $8.99/мес, $29.99/год, або $79.99 назаўсёды. Pro адкрывае Medium і Large мадэлі, пакетную апрацоўку, запіс сістэмнага аўдыя (Zoom-званкі, подкасты), падзяленне спікераў, Reader Mode, ChatGPT-інтэграцыю для суммарызацыі. Самы адпаліраваны Whisper-інтэрфейс для Mac. Рэйтынг ~4.0 на MacUpdate.

Whisper Notes (whispernotes.app) — $6.99 аднаразова для iOS + Mac. 60 000+ карыстальнікаў. Ключавая фішка — system-wide dictation: заціснуў Fn у любым прыкладанні → сказаў → адпусціў → тэкст устаўлены. Імпарт аўдыя/відэа файлаў са стрымінгавым вынікам. Цалкам афлайн, выкарыстоўвае Whisper Large V3 Turbo на Apple Silicon.

WhisperDesktop (github.com/Const-me/Whisper) — бясплатнае Windows-прыкладанне з GPU-паскарэннем праз DirectCompute/GPGPU. Значна хутчэйшае за арыгінальны Whisper: 3:24 хв аўдыя за 19 секунд на GeForce 1080Ti (супраць 45 сек у PyTorch+CUDA). Транскрыбацыя файлаў + запіс з мікрафона ў рэальным часе. Рэкамендаваная мадэль: ggml-medium.bin (~1.42 ГБ).

WhisperUI (Microsoft Store) — бясплатнае Windows-прыкладанне. GPU-паскарэнне праз CPU, OpenCL, NVIDIA CUDA 11/12. Цалкам афлайн, экспарт субтытраў у SRT/VTT, пакетная апрацоўка.

Aiko (~$5.99, iOS/Mac) — максімальна простае Whisper-прыкладанне для Apple. Drag-and-drop аўдыяфайла → тэкст. 100% on-device, ідэальна для тых, хто хоча транскрыбацыю адной кнопкай без налад.

Whisper Transcription (iOS App Store, freemium) — мабільнае прыкладанне з on-device і воблачным рэжымам. Share Extension дазваляе транскрыбіраваць галасавыя з iMessage, WhatsApp, Voice Memos. Патрабуецца iPhone 13+ для on-device. AI-суммарызацыя, чат з транскрыптам. Рэйтынг 4.6+.


Self-hosted рашэнні: для свайго сервера

Для тых, хто хоча разгарнуць паўнавартасны сэрвіс транскрыбацыі на сваім серверы або ў лакальнай сетцы.

Whishper (github.com/pluja/whishper) — паўнавартасная self-hosted платформа з вэб-інтэрфейсам. Уключае faster-whisper для транскрыбацыі, LibreTranslate/Argos Translate для перакладу субтытраў (60+ моў), убудаваны рэдактар субтытраў, экспарт у JSON/TXT/VTT/SRT. Разгортваецца праз Docker Compose (5 кантэйнераў: API, бэкенд, фронтэнд, пераклад, MongoDB). 100% афлайн пасля ўсталявання. Выдатны выбар для каманд, якім патрэбен прыватны сэрвіс без воблака.

WhisperLive (github.com/collabora/WhisperLive, Collabora) — open-source рашэнне для транскрыбацыі ў рэальным часе. WebSocket-сервер: падключаеш мікрафон або файл → атрымліваеш тэкст з мінімальнай затрымкай. Падтрымлівае faster-whisper, TensorRT і OpenVINO бэкенды. Python-кліент і JS-дэма. Падыходзіць для live-транскрыбацыі нарад і канферэнцый.

WhisperTranscribe (whispertranscribe.com) — воблачны сэрвіс з дэсктоп-прыкладаннем для Windows. Бясплатны трыял 60 хвілін без уводу карты. Выкарыстоўвае Whisper + AssemblyAI. Апроч транскрыбацыі: 57+ тыпаў кантэнту з аднаго запісу (посты, самары, маркетынгавыя матэрыялы), AI-трэніроўка на стыль карыстальніка, транскрыбацыя YouTube/Vimeo па спасылцы, подкастаў з бібліятэкі 2.5 млн. 55+ моў. Падпіска ~$15/мес.


Відэарэдактары з убудаванай транскрыбацыяй

Асобная катэгорыя — відэарэдактары, якія ўмеюць транскрыбіраваць аўдыя як частку workflow.

CapCut (ByteDance/TikTok) — бясплатны відэарэдактар з магутнай функцыяй Auto Captions. Падтрымлівае 100+ моў, уключаючы рускую. Транскрыбіруе маўленне ў субтытры, дазваляе рэдагаваць відэа на аснове тэксту (transcript-based editing), перакладаць субтытры, ствараць двухмоўныя субтытры. Вэб-версія, дэсктоп (Windows/Mac), мабільныя прыкладанні. Бясплатна. Абмежаванне: арыентаваны на субтытры, а не паўнавартасныя дакументы-транскрыпты.

Descript — магутны аўдыя/відэарэдактар з transcript-based editing (выдаляеш слова з тэксту → яно выразаецца з відэа). Не падтрымлівае рускую — толькі лацініца. Згадваю для паўнаты карціны.

DaVinci Resolve (Blackmagic Design) — прафесійны відэарэдактар з убудаванай транскрыбацыяй праз Whisper. Падтрымлівае рускую, але якасць саступае спецыялізаваным інструментам. Бясплатная версія даступная. Транскрыпцыя ў таймлайне для text-based editing.

Subtitle Edit (nikse.dk) — бясплатны open-source рэдактар субтытраў для Windows (часткова Linux) з інтэграванай транскрыбацыяй праз Whisper. Падтрымлівае 7+ Whisper-рухавікоў (OpenAI Whisper, Purfview's Faster-Whisper-XXL, CPP, CPP cuBLAS, Const-me, CTranslate2, stable-ts, WhisperX), пакетную апрацоўку, аўтапераклад, 100+ моў. Наймагутнейшы бясплатны інструмент для стварэння субтытраў з аўдыя. На RTX A6000 — 2 гадзіны за некалькі хвілін.

Subper / SubtitleWhisper (subtitlewhisper.com) — анлайн-генератар субтытраў на Whisper + Silero VAD. Анлайн-рэдактар субтытраў. Бясплатны план абмежаваны, платны ад $9.99/мес. GPT-інтэграцыя для пунктуацыі і параграфіравання.


Браўзерныя пашырэнні і анлайн-інструменты

Transkriptor — вэб-прыкладанне + пашырэнне для Chrome/Firefox + iOS/Android. Падтрымлівае рускую, аўтаматычная дыярызацыя, экспарт у TXT/SRT/DOCX. Бясплатны трыял, далей $9.99–30/мес. Заяўляе 99% дакладнасць (для рускай рэальная ніжэй).

TurboScribe (turboscribe.ai) — вэб-сэрвіс з 3 бясплатнымі транскрыбацыямі ў дзень (да 30 хв кожная). Руская ў спісе моў з «Excellent Accuracy». Платныя планы ад ~$10/мес. Whisper пад капотам.

Wonderscribe — цалкам бясплатны вэб-сэрвіс, але з павышаным працэнтам памылак (~16% WER). Для чарнавой расшыфроўкі.

HuggingFace Spaces (huggingface.co/spaces/openai/whisper) — бясплатны Whisper-дэма ад OpenAI. Загружаеце файл → атрымліваеце тэкст. Бясплатна, але з абмежаваннямі і чэргамі.

Speech2Text.ru — рускі сэрвіс, 3 бясплатныя гадзіны з дыярызацыяй спікераў.

Any2Text.ru — рускі сэрвіс, 15 хвілін без рэгістрацыі + 60 хвілін пры рэгістрацыі. Падтрымлівае транскрыбацыю відэа з ВКантакце па спасылцы.


Мабільныя прыкладанні

iOS

ПрыкладаннеЦанаАфлайнФішка
Aiko~$5.99 аднаразова100%Прасцейшы drag-and-drop
Whisper Notes$6.99 аднаразова100%System-wide дыктоўка праз Fn
Whisper TranscriptionFreemium (падпіска)iPhone 13+AI-суммарызацыя, чат з транскрыптам
Just Press Record~$4.99ЧастковаАдно націсканне, Apple Watch, iCloud sync
Whisper: Speech to TextFreemiumРозніццаПросты інтэрфейс для запісу+транскрыпцыі

Android

ПрыкладаннеЦанаАфлайнФішка
Voice NotebookБясплатна + PremiumЗ моўным пакетамЛепшая руская дыктоўка, рэйтынг 4.8
SpeechnotesБясплатна, 5М+ загрузакАбмежаванаЗапатэнтаваная клавіятура пунктуацыі
SpeechTexterБясплатна, 80+ моўНеБазавы voice-to-text
Notely VoiceБясплатна, без рэкламыТакWhisper на смартфоне для доўгіх нататак

Кросплатформныя

ПрыкладаннеПлатформыЦанаРуская
TranskriptoriOS/Android/Web/Chrome/Firefox$9.99–30/месТак
NottaiOS/Android/WebFree 120 хв/мес (3 хв/размова)Спрэчная якасць
VomoiOS/AndroidFreemiumГаласавыя нататкі + AI

Зводная табліца: выбар па сцэнарыі выкарыстання

СцэнарыйЛепшы выбарЦанаРуская
Хуткая дыктоўка ў любое полеHandy, Whisper NotesБясплатна / $6.99Whisper
Транскрыбацыя файлаў афлайнVibe, BuzzБясплатнаWhisper
macOS адпаліраваны GUIMacWhisper Pro$79.99 назаўсёдыWhisper
Windows GPU-паскарэннеWhisperDesktop, WhisperUIБясплатнаWhisper
Максімальная дакладнасць RUGigaChat (загрузіць аўдыя)БясплатнаGigaAM
Telegram-ботVoxbrief (@VidVKYT2AudioBot)БясплатнаYouTube, VK
Нарады Google Meet/TeamsУбудаваныя субтытрыУ складзе падпіскіТак
Субтытры для відэаSubtitle Edit + WhisperБясплатнаWhisper
Відэарэдактар + субтытрыCapCutБясплатнаТак
Self-hosted серверWhishperБясплатнаWhisper
Рэальны час (live)WhisperLiveБясплатнаWhisper
Чалавечая транскрыбацыяGoTranscript$1.20–2.75/хвНосьбіты
Enterprise API (RU-аптымізаваны)Yandex SpeechKit~₽0.64/хв95-97%
Enterprise API (бюджэтны)Tinkoff VoiceKit~₽0.40/хв~95%
Рускі сэрвіс усё-ў-аднымВойсі45 хв бясплатна98%
Мабільнае iOSAiko~$5.99Whisper
Мабільнае AndroidVoice NotebookБясплатнаGoogle STT
Кантэнт з запісаўWhisperTranscribe~$15/мес57+ фарматаў
Рускі вэб без рэгістрацыіAny2Text.ru15 хв бясплатнаТак

FAQ

Які бясплатны дадатак лепш за ўсё падыходзіць для транскрыбацыі?

Для настольнага камп'ютара лепшыя бясплатныя варыянты — Vibe і Buzz, абодва працуюць на базе Whisper і цалкам офлайн. Для анлайн-транскрыбацыі без усталёўкі — TurboScribe (3 файлы ў дзень да 30 хвілін бясплатна) і GigaChat ад Sber (загрузка аўдыя да 2 гадзін з дыярызацыяй і падсумкам).

Ці можна транскрыбаваць аўдыя офлайн без інтэрнэту?

Так. Усе настольныя дадаткі на базе Whisper (Vibe, Buzz, MacWhisper, WhisperDesktop) працуюць цалкам офлайн пасля спампоўкі мадэлі. Даныя не пакідаюць камп'ютар, што гарантуе прыватнасць.

Якія дадаткі лепш за ўсё распазнаюць рускую мову?

Найвышэйшую дакладнасць для рускай мовы забяспечвае GigaAM ад Sber (8,4% WER). Сярод бясплатных спажывецкіх інструментаў — GigaChat (загрузка аўдыя) і Yandex SpeechKit (enterprise API, 95–97% дакладнасці). Дадаткі на Whisper даюць прымальную якасць (~84% дакладнасці для рускай).

Які мабільны дадатак абраць для транскрыбацыі на тэлефоне?

На iOS лепшыя варыянты — Aiko (~$5.99, цалкам офлайн) і Whisper Notes ($6.99, сістэмная дыктоўка). На Android лідзіруе Voice Notebook (бясплатна, рэйтынг 4,8, лепшая руская дыктоўка праз Google STT).

Як разгарнуць уласны сервер транскрыбацыі?

Лепшы self-hosted варыянт — Whishper: паўнавартасная платформа з вэб-інтэрфейсам, разгортваецца праз Docker Compose, уключае транскрыбацыю праз faster-whisper, пераклад субтытраў і ўбудаваны рэдактар. Для транскрыбацыі ў рэальным часе падыдзе WhisperLive ад Collabora.