Усе артыкулы

Транскрыбацыя для рускамоўнага рынку: поўны гід па інструментах у 2025–2026

·35 хв чытання

GigaAM ад Sber дамінуе ў распазнаванні рускага маўлення, апярэджваючы Whisper ад OpenAI амаль удвая па дакладнасці, а GigaChat прапануе на здзіўленне магутную бясплатную транскрыбацыю. Рынак транскрыбацыі для рускамоўных карыстальнікаў значна сталеў: open-source мадэлі, навучаныя на рускай, цяпер пераўзыходзяць большасць камерцыйных мультымоўных сэрвісаў; буйныя заходнія платформы накшталт Google Meet і Microsoft Teams цалкам падтрымліваюць рускія субтытры; а расце экасістэма айчынных сэрвісаў (Yandex SpeechKit, SaluteSpeech, Войсі), створаных спецыяльна для СНД-аўдыторыі. Apple застаецца прыкметным аўтсайдэрам — транскрыбацыя Voice Memos па-ранейшаму не падтрымлівае рускую. Гэты гід ахоплівае ўсе катэгорыі інструментаў транскрыбацыі, даступных рускамоўным карыстальнікам — ад бясплатных Telegram-ботаў да enterprise API — з сумленнай ацэнкай якасці распазнавання рускай мовы для кожнага.


Разрыў у дакладнасці: чаму выбар мадэлі важнейшы за бранд

Не ўсе заявы пра «падтрымку рускай» аднолькавыя. Аўтарытэтны бенчмарк Alpha Cephei 2025 для рускага ASR, пратэсціраваны на 11 разнастайных рускамоўных датасетах (аўдыякнігі, кол-цэнтры, ТВ-трансляцыі, медыцынскае маўленне), выявіў істотныя адрозненні. GigaAM2 ад Sber дасягае 8.4% WER (Word Error Rate), што робіць яго беззаганным лідарам. Vosk ідзе з 11.0% WER, тады як OpenAI Whisper Large V3 адстае з 16.2% WER — прыкладна ўдвая горш за GigaAM. NeMo Canary V2 ад NVIDIA, нягледзячы на навізну, паказвае расчаравальныя 20.2% менавіта на рускай.

Гэта азначае, што інструмент на GigaAM памыліцца прыкладна ў 1 з 12 слоў, тады як інструмент на Whisper — у 1 з 6. На чыстым маўленні (аўдыякнігі) усе мадэлі працуюць добра (Vosk дасягае дзіўных 1.2% WER). Сапраўдная розніца праяўляецца на шумным, рэальным аўдыя: запісы кол-цэнтраў, нарады з перакрыжаванымі размовамі, тэлефонная якасць. Тут GigaAM і Vosk значна апярэджваюць Whisper.

МадэльСярэдні WER (руская)Лепшае прымяненне
GigaAM2 CTC+LM (Sber)8.4%Лепшая агульная дакладнасць
Vosk 0.54 (Alpha Cephei)11.0%Лёгкі афлайн/edge
T-one (Tinkoff)12.8%Стрымінг у рэальным часе
Whisper Podlodka Turbo13.8%Данавучаны Whisper
NeMo FastConformer RU14.0%Экасістэма NVIDIA GPU
Whisper Large V316.2%Мультымоўны ўніверсал
NeMo Canary V220.2%Пераклад EU-моў

Платныя міжнародныя сэрвісы: хто рэальна працуе з рускай

Сярод дзесятка буйных платных платформаў транскрыбацыі толькі нямногія прапануюць па-сапраўднаму добрую падтрымку рускай. Otter.ai і Descript увогуле не падтрымліваюць рускую — Otter выдае бязглуздзіцу на рускім аўдыя, а Descript яўна выключае ўсе мовы з нелацінскім алфавітам. Notta заяўляе рускую сярод 58 моў, але незалежнае тэсціраванне ў 2026 годзе паказала, што яна выдае бязладны тэкст, калі мова не абрана загадзя ўручную, і нават тады якасць ненадзейная.

Наймацнейшыя платныя варыянты для рускай дзеляцца на два ўзроўні. GoTranscript лідзіруе па дакладнасці з 100% чалавечай транскрыбацыяй носьбітамі рускай мовы з дакладнасцю 99.4%, па цане $1.20–2.75 за хвіліну і тэрмінамі 1–3 дні. Happy Scribe прапануе і AI (~85% дакладнасці), і чалавечую транскрыбацыю (99% дакладнасці, $1.75–2.00/хв) з вылучанай старонкай для рускай мовы і падтрымкай рэгіянальных акцэнтаў. Sonix вылучаецца празрыстай цаной $10/гадзіну з заяўленай дакладнасцю 85–99%.

Для распрацоўшчыкаў важныя API-сэрвісы. Speechmatics падтрымлівае on-premise разгортванне (важна для суверэннасці даных) і прапануе шчодры бясплатны тарыф — 8 гадзін/мес. AssemblyAI пакрывае рускую ў мадэлі Universal-2 на 99 мовах за $0.15–0.27/гадзіну з дыярызацыяй на 95 мовах. Deepgram прапануе найніжэйшы API-прайс (~$0.46/гадзіну), але бенчмаркі ўказваюць, што дакладнасць рускай (~8% WER) крыху саступае канкурэнтам. Maestra — самы функцыянальны варыянт: транскрыбацыя, пераклад праз DeepL, AI-дубляж з кланіраваннем голасу і жывыя субтытры — усё з падтрымкай рускай, ад $10/гадзіну.

СэрвісЯкасць рускайЦанаЛепшае прымяненне
GoTranscriptЧалавечая, 99.4%$1.20–2.75/хвМаксімальная дакладнасць
Happy ScribeAI + чалавек$17–49/мес + $2/хвГібрыдныя задачы
SonixAI, 85-99%$10/гадзінуПразрыстае AI-цэнаўтварэнне
SpeechmaticsAPI$0.30–0.70/гадзінуEnterprise, on-prem
MaestraУсё ў адным$10/гадзіну–$359/месМультымоўны ўсё-ў-адным
AssemblyAIAPI$0.15–0.27/гадзінуІнтэграцыя для распрацоўшчыкаў
TranskriptorБюджэтны$9.99–30/месБюджэтны варыянт
TrintЖурналістыка$52–100/месЖурналісцкія задачы

Бясплатныя варыянты, якія рэальна працуюць з рускай

Самы магутны бясплатны інструмент — OpenAI Whisper, усталяваны лакальна: неабмежаваны, цалкам прыватны, з прымальнай якасцю рускай на мадэлі large-v3. Нетэхнічныя карыстальнікі могуць скарыстацца дэсктопнымі GUI: Buzz (бясплатны, кросплатформны, некалькі бэкендаў), Vibe (бясплатны, просты, афлайн) або MacWhisper (бясплатная версія з малымі мадэлямі; $69 за Pro назаўсёды). Усе працуюць афлайн пасля спампоўвання мадэлі.

Для анлайн-транскрыбацыі без усталявання: TurboScribe — 3 бясплатныя транскрыбацыі ў дзень (да 30 хв кожная), руская ў спісе моў з высокай дакладнасцю. Speech2Text.ru — 3 бясплатныя гадзіны з дыярызацыяй спікераў. Any2Text.ru — 15 хвілін без рэгістрацыі + 60 пры рэгістрацыі. Wonderscribe — цалкам бясплатны, але з павышаным працэнтам памылак (~16% WER).

У экасістэме Telegram вылучаецца Voxbrief (@VidVKYT2AudioBot) — бясплатны бот для здабычы аўдыя з відэа YouTube і ВКантакце: перасылаеце спасылку або файл — атрымліваеце аўдыядарожку, гатовую для транскрыбацыі ў любым сэрвісе. Убудаваная транскрыбацыя Telegram Premium выкарыстоўвае Google Speech Recognition, падтрымлівае рускую — бясплатным карыстальнікам даступна 2 транскрыбацыі на тыдзень, Premium-падпісчыкам без абмежаванняў.

GigaChat ад Sber заслугоўвае асаблівай увагі. Абнаўленне 2.0 (сакавік 2025) дадало натыўную апрацоўку аўдыя — загружаеце файл да 2 гадзін і атрымліваеце транскрыпцыю з дыярызацыяй, разумнай пунктуацыяй і AI-самары. Даступны праз вэб (giga.chat), Telegram-бот і VK MAX, без падпіскі і VPN.


Буйныя тэхналагічныя платформы: дзе руская транскрыбацыя

Apple — горшы па падтрымцы рускай ва ўсёй сваёй экасістэме. Транскрыбацыя Voice Memos (з'явілася ў iOS 18) падтрымлівае толькі 10 моў — рускай сярод іх няма. Live Captions абмежаваныя англійскай (ЗША і Канада). Функцыі Apple Intelligence маюць тыя ж абмежаванні. Адзіны плюс — Siri dictation, якая падтрымлівае рускую з iOS 8.3 (2015) і працуе нядрэнна на чыстым маўленні, хоць карыстальнікі адзначаюць багі з вяртаннем кірылічнага тэксту да лацініцы.

Google прапануе самую шырокую падтрымку рускай. Google Meet падтрымлівае рускія субтытры з снежня 2022, зараз пакрываючы 87 моў для субтытраў і 69+ для перакладных субтытраў (платныя Workspace-падпіскі). Google Docs Voice Typing працуе з рускай і галасавымі камандамі пунктуацыі. YouTube дае рускія аўтасубтытры з 2012 года з пераменнай якасцю (~60–70%). Google Cloud Speech-to-Text забяспечвае enterprise-ўзровень распазнавання рускай.

Microsoft не саступае Google. Транскрыбацыя і жывыя субтытры Teams цалкам падтрымліваюць рускую сярод 60+ моў, перакладныя субтытры даступныя праз Teams Premium. Дыктоўка ў Word/Office працуе з рускай. Azure Speech-to-Text забяспечвае поўную падтрымку рускай: стрымінг, пакетная апрацоўка, кастомныя мадэлі. Прабел: Windows Voice Access і новы AI Interpreter у Teams (першапачаткова 9 моў) пакуль не падтрымліваюць рускую.

Zoom падтрымлівае рускую для аўтасубтытраў (49 моў) і перакладных субтытраў (36 моўных пар, $5/мес). Аднак карыстальнікі адзначаюць, што якасць перакладных рускіх субтытраў «неадэкватная» — Zoom афіцыйна адказаў, што якасць «на ўзроўні або лепш за канкурэнтаў» і пастаянна паляпшаецца.


Расійскія і СНД-сэрвісы: перавага дамашняга поля

Расійскі рынак нарадзіў некалькі моцных айчынных платформаў, навучаных спецыяльна на рускіх маўленчых патэрнах, акцэнтах і тэлефоннай якасці аўдыя.

Yandex SpeechKit застаецца залатым стандартам enterprise-распазнавання рускага маўлення з заяўленай дакладнасцю 95–97% і працай у Алісе. Толькі API, без спажывецкага прадукту, цана ~₽0.64/хв для сінхроннага распазнавання. Падтрымлівае on-premise праз SpeechKit Hybrid — крытычна для арганізацый з патрабаваннямі да суверэннасці даных. Мовы абмежаваныя рускай, англійскай і турэцкай.

Sber SaluteSpeech — самы даступны расійскі enterprise-сэрвіс з бясплатным тарыфам 100 хвілін на месяц для фізасоб (некамерцыйнае выкарыстанне). Дэсктопнае прыкладанне для Windows і macOS аб'ядноўвае распазнаванне, сінтэз і GigaChat. Enterprise-прадукт SaluteSpeech Insights забяспечвае аналітыку кол-цэнтраў.

Tinkoff VoiceKit (цяпер T-Bank) — найтанейшы расійскі API па цане ~₽0.40–0.45/хв, навучаны на тэрабайтах даных кол-цэнтраў. Заяўляе ~95% дакладнасці і бясплатны для адукацыйных устаноў.

VK Званкі запусцілі бясплатную ўбудаваную транскрыбацыю ў жніўні 2023 на ўласнай нейрасетцы — тэкст з таймкодамі і пазнакамі спікераў адпраўляецца ў чат званка як .txt файл. Пакуль толькі руская.

Сярод спажывецкіх расійскіх сэрвісаў вылучаецца Войсі — 98% заяўленай дакладнасці, 16 фарматаў вываду (стэнаграма, пратакол нарады, задачы, самары, субтытры), боты ў Telegram, VK і MAX — 45 бясплатных хвілін пры першым выкарыстанні. Guru Scribe — уражлівая хуткасць: 27 секунд на гадзіну аўдыя без дыярызацыі, ад ₽4/хв з 60 бясплатнымі хвілінамі. Teamlogs падключаецца напрамую да Zoom, Google Meet і Яндэкс Тэлемост для жывой транскрыбацыі, ад ₽6/хв. MyMeet.ai фокусуецца на транскрыбацыі нарад з ~96% дакладнасцю і інтэгруецца з усімі асноўнымі платформамі.


Open-source: GigaAM кіруе, але ў Whisper ёсць экасістэма

Для распрацоўшчыкаў open-source ландшафт прапануе лепшае суадносіны якасці і цаны. GigaAM v3 (Sber, ліцэнзія MIT) — беззаганны лідар для транскрыбацыі толькі рускай: end-to-end мадэлі з пунктуацыяй і нармалізацыяй тэксту, навучаныя на 700 000 гадзінах рускага маўлення. Python API просты: усталяваць gigaam, загрузіць мадэль, выклікаць transcribe(). Абмежаванне — толькі руская, без мультымоўнасці, і пакуль няма GUI-прыкладанняў.

Vosk (ліцэнзія Apache 2.0) — лепшы выбар для афлайн і edge-прылад. Руская мадэль дасягае 11% WER нават на Raspberry Pi — малая мадэль усяго ~50 МБ. Прывязкі для Python, Java, C#, JavaScript, Go і Rust, плюс Android і iOS SDK. Асаблівая сіла — аўдыякнігі і чыстае маўленне, дзе дасягаецца дзіўных 1.2% WER.

Whisper і яго вытворныя прапануюць лепшую мультымоўную гнуткасць. Хоць дакладнасць рускай (~16% WER) саступае GigaAM і Vosk, ён падтрымлівае 99 моў і нарадзіў багатую экасістэму інструментаў. faster-whisper працуе ~4x хутчэй з ідэнтычнай дакладнасцю на INT8/FP16. whisper.cpp дазваляе працаваць толькі на CPU на Apple Silicon, x86 і мабільных прыладах. WhisperX дадае паслоўныя таймстампы і дыярызацыю праз pyannote-audio. Данавучаныя рускія мадэлі на HuggingFace (antony66/whisper-large-v3-russian) зніжаюць WER з 16.2% да ~6.4%.

Для нетэхнічных карыстальнікаў лепшыя дэсктопныя GUI: Buzz (бясплатны, кросплатформны, faster-whisper/whisper.cpp, падзяленне спікераў), MacWhisper ($69 Pro назаўсёды, пакетная апрацоўка, запіс сістэмнага аўдыя) і Vibe (бясплатны, просты, ~5 000 зорак на GitHub). Усе працуюць афлайн пасля спампоўвання мадэлі.


Мабільныя прыкладанні: лепшыя варыянты для iOS і Android

На iOS дамінуюць прыкладанні на базе Whisper. Aiko (~$5.99, разавая пакупка) працуе цалкам на прыладзе — ідэальны для тых, каму важная прыватнасць. Whisper Notes ($4.99–6.99, разава) дадае запіс з экрана блакіроўкі, карыстальніцкі слоўнік і Whisper Large V3 Turbo на Apple Silicon. Whisper Transcription (freemium) прапануе воблачны і on-device рэжымы з AI-самары, рэйтынг 4.6+. Just Press Record ($4.99) — прасцейшы workflow: адно націсканне для запісу з Apple Watch з аўтаматычнай транскрыбацыяй праз iCloud.

На Android лідзіруе Voice Notebook (бясплатна з рэкламай, Premium) — лепшае прыкладанне для рускай дыктоўкі, Google Speech Recognition з афлайн-падтрымкай праз спампаваныя моўныя пакеты, рэйтынг 4.8/5. Speechnotes (бясплатна, 5М+ загрузак) — запатэнтаваная клавіятура для пунктуацыі без спынення дыктоўкі. SpeechTexter (бясплатна, 80+ моў) — прасцейшая альтэрнатыва.

Кросплатформныя: Transkriptor (iOS/Android/Web, пробны перыяд, потым ~$4.99/мес) і Notta (iOS/Android/Web, бясплатна 120 хв/мес пры абмежаванні 3 хв/размова) — воблачная транскрыбацыя з дыярызацыяй, хоць якасць рускай у Notta выклікае пытанні.

ПрыкладаннеПлатформаЦанаАфлайнЯкасць рускай
AikoiOS/Mac~$5.99 разава100%Добрая (Whisper)
Whisper NotesiOS/Mac$4.99–6.99 разава100%Добрая (Whisper)
Whisper TranscriptioniOS/MacFreemiumiPhone 13+Добрая (Whisper)
Voice NotebookAndroidБясплатна/PremiumЗ пакетамДобрая (Google STT)
SpeechnotesAndroidБясплатна/PremiumАбмежаванаДобрая (Google STT)
Just Press RecordiOS~$4.99 разаваЧастковаСярэдняя

Дэсктопныя прыкладанні: Whisper з чалавечым тварам

Для тых, каму патрэбен просты GUI без каманднага радка, вырасла цэлая экасістэма дэсктопных прыкладанняў на базе Whisper. Усе яны працуюць афлайн, даныя не пакідаюць камп'ютар.

Handy (handy.computer) — бясплатнае open-source прыкладанне для macOS/Windows/Linux з унікальным падыходам: push-to-talk дыктоўка проста ў любое тэкставае поле. Націснуў хоткей, сказаў, адпусціў — тэкст устаўлены ў актыўнае акно. Ідэальна для замены клавіятуры пры наборы тэксту, перапісцы і нататках. Пабудавана на Whisper, цалкам афлайн і прыватна.

Vibe (thewh1teagle.github.io/vibe) — адно з лепшых бясплатных open-source рашэнняў з 5 000+ зорак на GitHub. Кросплатформны (Windows, macOS, Linux), пабудаваны на Tauri + whisper.cpp. Падтрымлівае GPU-паскарэнне (NVIDIA, AMD, Apple Silicon), 90+ моў, дыярызацыю спікераў, экспарт у SRT/VTT/TXT/DOCX/PDF, транскрыбацыю YouTube-спасылак праз yt-dlp, запіс з мікрафона, суммарызацыю праз Claude/Ollama і нават HTTP API. Самы функцыянальны бясплатны дэсктоп-кліент.

Buzz (buzzcaptions.com) — яшчэ адзін бясплатны open-source GUI для Whisper. Кросплатформны, падтрымлівае некалькі бэкендаў (whisper.cpp, faster-whisper), падзяленне спікераў, экспарт субтытраў. Больш мінімалістычны, чым Vibe, але стабільны і правераны.

MacWhisper / Whisper Transcription (App Store) — натыўнае macOS-прыкладанне з бясплатнай версіяй (мадэлі Base і Small) і Pro-падпіскай ($8.99/мес або $79.99 назаўсёды). Pro адкрывае мадэлі Medium і Large, пакетную апрацоўку, запіс сістэмнага аўдыя (Zoom-званкі, подкасты), падзяленне спікераў і Reader Mode. Самы адпаліраваны Whisper-інтэрфейс для Mac.

Whisper Notes (whispernotes.app) — $6.99 аднаразова для iOS + Mac. 60 000+ карыстальнікаў. Ключавая фішка — system-wide dictation: заціснуў Fn у любым прыкладанні, сказаў, адпусціў — тэкст устаўлены. Цалкам афлайн, выкарыстоўвае Whisper Large V3 Turbo на Apple Silicon.

WhisperDesktop (github.com/Const-me/Whisper) — бясплатнае Windows-прыкладанне з GPU-паскарэннем праз DirectCompute. Хутчэйшае за арыгінальны Whisper: 3:24 аўдыя апрацоўваюцца за 19 секунд на GeForce 1080Ti (супраць 45 сек у PyTorch+CUDA). Падтрымлівае транскрыбацыю файлаў і запіс з мікрафона ў рэальным часе.

WhisperUI (Microsoft Store) — бясплатнае Windows-прыкладанне з падтрымкай GPU праз CUDA 11/12 і OpenCL. Цалкам афлайн, субтытры ў SRT/VTT, пакетная апрацоўка.

Aiko (~$5.99, iOS/Mac) — максімальна простае Whisper-прыкладанне для Apple. Drag-and-drop аўдыяфайла → тэкст. Цалкам on-device, ідэальна для тых, хто хоча транскрыбацыю адной кнопкай без налад.


Self-hosted рашэнні: для свайго сервера

Для тых, хто хоча разгарнуць паўнавартасны сэрвіс транскрыбацыі на сваім серверы (або ў лакальнай сетцы), ёсць некалькі магутных open-source праектаў.

Whishper (github.com/pluja/whishper) — паўнавартасная self-hosted платформа з вэб-інтэрфейсам. Уключае faster-whisper для транскрыбацыі, LibreTranslate для перакладу субтытраў (60+ моў), убудаваны рэдактар субтытраў, экспарт у JSON/TXT/VTT/SRT. Разгортваецца праз Docker Compose. 100% афлайн пасля ўсталявання. Выдатны выбар для каманд, якім патрэбен прыватны сэрвіс транскрыбацыі без воблака.

WhisperLive (github.com/collabora/WhisperLive) — open-source рашэнне для транскрыбацыі ў рэальным часе. Працуе як сервер з WebSocket-кліентамі: падключаеш мікрафон або файл — атрымліваеш тэкст з мінімальнай затрымкай. Падтрымлівае faster-whisper, TensorRT і OpenVINO бэкенды. Падыходзіць для live-транскрыбацыі нарад і канферэнцый.

WhisperTranscribe (whispertranscribe.com) — воблачны сэрвіс з бясплатным трыялам 60 хвілін. Выкарыстоўвае Whisper + AssemblyAI. Апроч транскрыбацыі, генеруе 57+ тыпаў кантэнту з аднаго запісу (посты, самары, маркетынгавыя матэрыялы). Дэсктопнае Windows-прыкладанне. Падпіска ад ~$15/мес.


Відэарэдактары з убудаванай транскрыбацыяй

Асобная катэгорыя — відэарэдактары, якія ўмеюць транскрыбіраваць аўдыя як частку працоўнага працэсу.

CapCut (ByteDance/TikTok) — бясплатны відэарэдактар з магутнай функцыяй Auto Captions. Падтрымлівае 100+ моў уключаючы рускую. Транскрыбіруе маўленне ў субтытры, дазваляе рэдагаваць відэа на аснове тэксту (transcript-based editing), перакладаць субтытры паміж мовамі. Вэб-версія, дэсктоп (Windows/Mac), мабільныя прыкладанні. Бясплатна, але арыентаваны на субтытры, а не паўнавартасныя транскрыпты.

Descript — магутны аўдыя/відэарэдактар з transcript-based editing (выдаляеш слова з тэксту — яно выразаецца з відэа). Аднак не падтрымлівае рускую — толькі лацініца.

DaVinci Resolve (Blackmagic) — прафесійны відэарэдактар з убудаванай транскрыбацыяй праз Whisper. Падтрымлівае рускую, але якасць саступае спецыялізаваным інструментам. Бясплатная версія даступная.

Subtitle Edit (nikse.dk) — бясплатны open-source рэдактар субтытраў для Windows з інтэграванай транскрыбацыяй праз Whisper. Падтрымлівае 7 Whisper-рухавікоў (OpenAI, Faster-Whisper, CPP, Const-me, WhisperX і інш.), пакетную апрацоўку, пераклад, 100+ моў. Наймагутнейшы бясплатны інструмент для стварэння субтытраў з аўдыя.


Браўзерныя пашырэнні і анлайн-інструменты

Transkriptor — даступны як вэб-прыкладанне, пашырэнне для Chrome/Firefox, мабільнае прыкладанне (iOS/Android). Падтрымлівае рускую, аўтаматычная дыярызацыя, экспарт у TXT/SRT/DOCX. Бясплатны трыял, далей $9.99–30/мес. Заяўляе 99% дакладнасць, але для рускай рэальная дакладнасць ніжэй.

TurboScribe (turboscribe.ai) — вэб-сэрвіс з 3 бясплатнымі транскрыбацыямі ў дзень (да 30 хв кожная). Руская ў спісе моў з высокай дакладнасцю. Платныя планы ад $10/мес здымаюць ліміты. Выкарыстоўвае Whisper пад капотам.

Wonderscribe — цалкам бясплатны вэб-сэрвіс, але з больш высокім працэнтам памылак (~16% WER). Падыходзіць для чарнавой расшыфроўкі, калі дакладнасць не крытычная.

HuggingFace Spaces — OpenAI размясціў бясплатны Whisper-дэма на huggingface.co/spaces/openai/whisper. Загружаеце файл, атрымліваеце тэкст. Бясплатна, але з абмежаваннямі па даўжыні і чэргамі.


Нішавыя і вузкаспецыялізаваныя інструменты

Vomo (vomo.ai) — мабільнае прыкладанне (iOS/Android) для галасавых нататак з AI-транскрыбацыяй. Арыентавана на personal productivity: запісаў думку — атрымаў структураваную нататку з action items. Падтрымлівае рускую.

Subper / SubtitleWhisper (subtitlewhisper.com) — бясплатны анлайн-генератар субтытраў на Whisper + Silero VAD. Фокус на субтытрах для відэакантэнту. Ёсць анлайн-рэдактар. Бясплатны план абмежаваны, платны ад $9.99/мес.

Just Press Record ($4.99, iOS) — мінімалістычнае прыкладанне Apple: адно націсканне для запісу з Apple Watch або iPhone, аўтаматычная транскрыбацыя праз iCloud. Падтрымлівае рускую праз Apple Dictation. Ідэальна для хуткіх галасавых нататак.

Voice Notebook (Android, бясплатна з рэкламай) — лепшае Android-прыкладанне для рускай дыктоўкі, рэйтынг 4.8/5. Выкарыстоўвае Google Speech Recognition з афлайн-падтрымкай праз спампаваныя моўныя пакеты.

Speechnotes (Android, бясплатна, 5М+ загрузак) — запатэнтаваная клавіятура для пунктуацыі без спынення дыктоўкі.


Зводная табліца: выбар па сцэнарыі выкарыстання

СцэнарыйЛепшы выбарЦанаРуская
Хуткая дыктоўка ў любое полеHandy, Whisper NotesБясплатна / $6.99Whisper
Транскрыбацыя файлаў афлайнVibe, BuzzБясплатнаWhisper
macOS адпаліраваны GUIMacWhisper Pro$79.99 назаўсёдыWhisper
Windows GPU-паскарэннеWhisperDesktop, WhisperUIБясплатнаWhisper
Максімальная дакладнасць RUGigaChat (загрузіць аўдыя)БясплатнаGigaAM
Telegram-ботVoxbrief (@VidVKYT2AudioBot)БясплатнаYouTube, VK
Нарады Google Meet/TeamsУбудаваныя субтытрыУ складзе падпіскіТак
Субтытры для відэаSubtitle Edit + WhisperБясплатнаWhisper
Відэарэдактар + субтытрыCapCutБясплатнаТак
Self-hosted серверWhishperБясплатнаWhisper
Транскрыбацыя ў рэальным часеWhisperLiveБясплатнаWhisper
Чалавечая транскрыбацыяGoTranscript$1.20–2.75/хвНосьбіты
Enterprise API (RU-аптымізаваны)Yandex SpeechKit~₽0.64/хв95-97%
Enterprise API (бюджэтны)Tinkoff VoiceKit~₽0.40/хв~95%
Рускі сэрвіс усё-ў-аднымВойсі45 хв бясплатна98%
Мабільнае прыкладанне iOSAiko~$5.99Whisper
Мабільнае прыкладанне AndroidVoice NotebookБясплатнаGoogle STT

Заключэнне: як выбраць падыходны інструмент

Рынак транскрыбацыі для рускамоўных карыстальнікаў у 2025–2026 больш не пакутуе ад разрыву ў якасці з англійскай. Ключавая выснова: архітэктура мадэлі важнейшая за назву бранда — інструменты на GigaAM даюць амаль удвая лепшую дакладнасць для рускай, чым інструменты на Whisper, хоць большасць міжнародных сэрвісаў выкарыстоўваюць менавіта Whisper.

Для звычайных карыстальнікаў, якім патрэбна транскрыбацыя без наладкі, GigaChat (бясплатны, вэб/Telegram) і Voxbrief (@VidVKYT2AudioBot) (бясплатны Telegram-бот для здабычы аўдыя з відэа) — лепшыя кропкі ўваходу. Для прафесіяналаў, якім патрэбна рэгулярная транскрыбацыя нарад, Google Meet і Microsoft Teams натыўна падтрымліваюць рускія субтытры, а Войсі і MyMeet.ai дадаюць AI-пратаколы нарад. Для максімальнай дакладнасці на важных запісах — чалавечая транскрыбацыя GoTranscript (99.4%) або Happy Scribe з носьбітамі мовы застаюцца непераўзыдзенымі. Для распрацоўшчыкаў — GigaAM v3 (MIT, лепшая дакладнасць) для рускай або Speechmatics/AssemblyAI API для мультымоўных задач.

Галоўны прабел — экасістэма Apple: рускамоўныя карыстальнікі на iPhone і Mac не могуць выкарыстоўваць транскрыбацыю Voice Memos, Live Captions і функцыі Apple Intelligence для рускай. Пакуль Apple не пашырыць моўную падтрымку, прыкладанні на базе Whisper — Aiko і Whisper Notes — застаюцца лепшай альтэрнатывай, працуючы цалкам на прыладзе з поўнай прыватнасцю.

FAQ

Якая мадэль распазнавання маўлення лепш за ўсё працуе з рускай мовай?

GigaAM2 ад Sber — бясспрэчны лідар з 8,4% [WER (Word Error Rate)](/be/blog/word-error-rate-explained) на бенчмарку Alpha Cephei 2025. Для параўнання: [OpenAI Whisper](/be/blog/openai-whisper-guide) Large V3 паказвае 16,2% WER — амаль удвая горш. Vosk займае другое месца з 11,0% WER.

Чым GigaAM адрозніваецца ад Whisper для рускай мовы?

GigaAM навучана на 700 000 гадзінах рускага маўлення і памыляецца прыкладна ў 1 з 12 слоў, тады як Whisper — у 1 з 6. Галоўны недахоп GigaAM — падтрымка толькі рускай мовы, тады як Whisper працуе з 99 мовамі і мае багатую экасістэму GUI-дадаткаў.

Які самы танны enterprise API для транскрыбацыі рускай?

Сярод расійскіх сэрвісаў самы танны — Tinkoff VoiceKit па цане ~₽0,40/хв з дакладнасцю ~95%. Yandex SpeechKit каштуе ~₽0,64/хв пры дакладнасці 95–97%. Сярод міжнародных — Deepgram (~$0,46/гадз) і AssemblyAI ($0,15–0,27/гадз).

Ці варта замаўляць чалавечую транскрыбацыю замест ІІ?

Для крытычна важных запісаў — так. GoTranscript забяспечвае 99,4% дакладнасці з носьбітамі рускай мовы па цане $1,20–2,75/хв. ІІ-транскрыбацыя (8–16% WER) падыходзіць для большасці задач, але для юрыдычных дакументаў, медыцынскіх запісаў і публікацый чалавечая транскрыбацыя надзейнейшая.

Якія бясплатныя інструменты транскрыбацыі працуюць з рускай мовай?

GigaChat ад Sber — лепшы бясплатны варыянт без усталёўкі (вэб, Telegram, файлы да 2 гадзін з дыярызацыяй). Для офлайн-працы — Vibe і Buzz (бясплатныя настольныя GUI на базе Whisper). Анлайн: TurboScribe (3 файлы/дзень па 30 хв) і Any2Text.ru (15 хвілін без рэгістрацыі).