Усі статті

Транскрибація для російськомовного ринку: повний гід по інструментах у 2025–2026

·35 хв читання

GigaAM від Sber домінує у розпізнаванні російського мовлення, випереджаючи Whisper від OpenAI майже вдвічі за точністю, а GigaChat пропонує напрочуд потужну безкоштовну транскрибацію. Ринок транскрибації для російськомовних користувачів значно подорослішав: open-source моделі, навчені на російській, тепер перевершують більшість комерційних мультимовних сервісів; великі західні платформи на кшталт Google Meet і Microsoft Teams повністю підтримують російські субтитри; а зростаюча екосистема вітчизняних сервісів (Yandex SpeechKit, SaluteSpeech, Войси) створена спеціально для СНД-аудиторії. Apple залишається помітним аутсайдером — транскрибація Voice Memos досі не підтримує російську. Цей гід охоплює всі категорії інструментів транскрибації, доступних російськомовним користувачам — від безкоштовних Telegram-ботів до enterprise API — з чесною оцінкою якості розпізнавання російської мови для кожного.


Розрив у точності: чому вибір моделі важливіший за бренд

Не всі заяви про «підтримку російської» однакові. Авторитетний бенчмарк Alpha Cephei 2025 для російського ASR, протестований на 11 різноманітних російськомовних датасетах (аудіокниги, кол-центри, ТВ-трансляції, медичне мовлення), виявив суттєві відмінності. GigaAM2 від Sber досягає 8,4% WER (Word Error Rate), що робить його беззаперечним лідером. Vosk іде за ним із 11,0% WER, тоді як OpenAI Whisper Large V3 відстає з 16,2% WER — приблизно вдвічі гірше за GigaAM. NeMo Canary V2 від NVIDIA, попри новизну, показує розчаровуючі 20,2% саме на російській.

Це означає, що інструмент на GigaAM помилиться приблизно в 1 з 12 слів, тоді як інструмент на Whisper — в 1 з 6. На чистому мовленні (аудіокниги) всі моделі працюють добре (Vosk досягає вражаючих 1,2% WER). Справжня різниця проявляється на шумному, реальному аудіо: записи кол-центрів, наради з перехресними розмовами, телефонна якість. Тут GigaAM і Vosk значно випереджають Whisper.

МодельСередній WER (російська)Найкраще застосування
GigaAM2 CTC+LM (Sber)8,4%Найкраща загальна точність
Vosk 0.54 (Alpha Cephei)11,0%Легкий офлайн/edge
T-one (Tinkoff)12,8%Стримінг у реальному часі
Whisper Podlodka Turbo13,8%Донавчений Whisper
NeMo FastConformer RU14,0%Екосистема NVIDIA GPU
Whisper Large V316,2%Мультимовний універсал
NeMo Canary V220,2%Переклад мов ЄС

Платні міжнародні сервіси: хто реально працює з російською

Серед десятка великих платних платформ транскрибації лише небагато пропонують по-справжньому гарну підтримку російської. Otter.ai і Descript взагалі не підтримують російську — Otter видає безглуздя на російському аудіо, а Descript явно виключає всі мови з нелатинським алфавітом. Notta заявляє російську серед 58 мов, але незалежне тестування у 2026 році показало, що вона видає нез'язний текст, якщо мову не обрано заздалегідь вручну, і навіть тоді якість ненадійна.

Найсильніші платні варіанти для російської поділяються на два рівні. GoTranscript лідирує за точністю з 100% людською транскрибацією носіями російської мови з точністю 99,4%, за ціною $1,20–2,75 за хвилину і термінами 1–3 дні. Happy Scribe пропонує і AI (~85% точності), і людську транскрибацію (99% точності, $1,75–2,00/хв) з виділеною сторінкою для російської мови та підтримкою регіональних акцентів. Sonix вирізняється прозорою ціною $10/година із заявленою точністю 85–99%.

Для розробників важливі API-сервіси. Speechmatics підтримує on-premise розгортання (важливо для суверенності даних) і пропонує щедрий безкоштовний тариф — 8 годин/міс. AssemblyAI покриває російську в моделі Universal-2 на 99 мов за $0,15–0,27/год з діаризацією на 95 мовах. Deepgram пропонує найнижчий API-прайс (~$0,46/год), але бенчмарки вказують, що точність російської (~8% WER) трохи поступається конкурентам. Maestra — найфункціональніший варіант: транскрибація, переклад через DeepL, AI-дубляж з клонуванням голосу і живі субтитри — все з підтримкою російської, від $10/год.

СервісЯкість російськоїЦінаНайкраще застосування
GoTranscriptЛюдська, 99,4%$1,20–2,75/хвМаксимальна точність
Happy ScribeAI + людська$17–49/міс + $2/хвГібридні завдання
SonixAI, 85-99%$10/годПрозоре AI-ціноутворення
SpeechmaticsAPI$0,30–0,70/годEnterprise, on-prem
MaestraВсе в одному$10/год–$359/місМультимовний все-в-одному
AssemblyAIAPI$0,15–0,27/годІнтеграція для розробників
TranskriptorБюджетний$9,99–30/місБюджетний варіант
TrintЖурналістика$52–100/місЖурналістські завдання

Безкоштовні варіанти, які реально працюють з російською

Найпотужніший безкоштовний інструмент — OpenAI Whisper, встановлений локально: необмежений, повністю приватний, з прийнятною якістю російської на моделі large-v3. Нетехнічні користувачі можуть скористатися десктопними GUI: Buzz (безкоштовний, кросплатформний, кілька бекендів), Vibe (безкоштовний, простий, офлайн) або MacWhisper (безкоштовна версія з малими моделями; $69 за Pro назавжди). Усі працюють офлайн після завантаження моделі.

Для онлайн-транскрибації без встановлення: TurboScribe — 3 безкоштовні транскрибації на день (до 30 хв кожна), російська в списку мов з високою точністю. Speech2Text.ru — 3 безкоштовні години з діаризацією спікерів. Any2Text.ru — 15 хвилин без реєстрації + 60 при реєстрації. Wonderscribe — повністю безкоштовний, але з підвищеним відсотком помилок (~16% WER).

В екосистемі Telegram вирізняється Voxbrief (@VidVKYT2AudioBot) — безкоштовний бот для вилучення аудіо з відео YouTube та ВКонтакте: пересилаєте посилання або файл — отримуєте аудіодоріжку, готову для транскрибації в будь-якому сервісі. Вбудована транскрибація Telegram Premium використовує Google Speech Recognition, підтримує російську — безкоштовним користувачам доступно 2 транскрибації на тиждень, Premium-підписникам без обмежень.

GigaChat від Sber заслуговує на особливу увагу. Оновлення 2.0 (березень 2025) додало нативну обробку аудіо — завантажуєте файл до 2 годин і отримуєте транскрипцію з діаризацією, розумною пунктуацією й AI-самері. Доступний через веб (giga.chat), Telegram-бот і VK MAX, без підписки і VPN.


Великі технологічні платформи: де російська транскрибація

Apple — найгірший за підтримкою російської у всій своїй екосистемі. Транскрибація Voice Memos (з'явилася в iOS 18) підтримує лише 10 мов — російської серед них немає. Live Captions обмежені англійською (США і Канада). Функції Apple Intelligence мають ті ж обмеження. Єдиний плюс — Siri dictation, що підтримує російську з iOS 8.3 (2015) і працює непогано на чистому мовленні, хоча користувачі відзначають баги з поверненням кириличного тексту до латиниці.

Google пропонує найширшу підтримку російської. Google Meet підтримує російські субтитри з грудня 2022, зараз покриваючи 87 мов для субтитрів і 69+ для перекладних субтитрів (платні Workspace-підписки). Google Docs Voice Typing працює з російською і голосовими командами пунктуації. YouTube надає російські автосубтитри з 2012 року зі змінною якістю (~60–70%). Google Cloud Speech-to-Text забезпечує enterprise-рівень розпізнавання російської.

Microsoft не поступається Google. Транскрибація і живі субтитри Teams повністю підтримують російську серед 60+ мов, перекладні субтитри доступні через Teams Premium. Диктування в Word/Office працює з російською. Azure Speech-to-Text забезпечує повну підтримку російської: стримінг, пакетна обробка, кастомні моделі. Прогалина: Windows Voice Access і новий AI Interpreter у Teams (початково 9 мов) поки що не підтримують російську.

Zoom підтримує російську для автосубтитрів (49 мов) і перекладних субтитрів (36 мовних пар, $5/міс). Проте користувачі зазначають, що якість перекладних російських субтитрів «неадекватна» — Zoom офіційно відповів, що якість «на рівні або краще за конкурентів» і постійно покращується.


Російські та СНД-сервіси: перевага домашнього поля

Російський ринок породив кілька сильних вітчизняних платформ, навчених спеціально на російських мовленнєвих патернах, акцентах і телефонній якості аудіо.

Yandex SpeechKit залишається золотим стандартом enterprise-розпізнавання російського мовлення із заявленою точністю 95–97% і роботою в Алісі. Тільки API, без споживчого продукту, ціна ~₽0,64/хв для синхронного розпізнавання. Підтримує on-premise через SpeechKit Hybrid — критично для організацій з вимогами до суверенності даних. Мови обмежені російською, англійською та турецькою.

Sber SaluteSpeech — найдоступніший російський enterprise-сервіс із безкоштовним тарифом 100 хвилин на місяць для фізичних осіб (некомерційне використання). Десктопний додаток для Windows і macOS об'єднує розпізнавання, синтез і GigaChat. Enterprise-продукт SaluteSpeech Insights забезпечує аналітику кол-центрів.

Tinkoff VoiceKit (тепер T-Bank) — найдешевший російський API за ціною ~₽0,40–0,45/хв, навчений на терабайтах даних кол-центрів. Заявляє ~95% точності й безкоштовний для освітніх установ.

VK Звонки запустили безкоштовну вбудовану транскрибацію у серпні 2023 на власній нейромережі — текст з таймкодами і мітками спікерів надсилається в чат дзвінка як .txt файл. Поки що тільки російська.

Серед споживчих російських сервісів вирізняється Войси — 98% заявленої точності, 16 форматів виведення (стенограма, протокол наради, завдання, самері, субтитри), боти в Telegram, VK і MAX — 45 безкоштовних хвилин при першому використанні. Guru Scribe — вражаюча швидкість: 27 секунд на годину аудіо без діаризації, від ₽4/хв з 60 безкоштовними хвилинами. Teamlogs підключається безпосередньо до Zoom, Google Meet і Яндекс Телемост для живої транскрибації, від ₽6/хв. MyMeet.ai фокусується на транскрибації нарад з ~96% точністю та інтеграцією з усіма основними платформами.


Open-source: GigaAM панує, але Whisper має екосистему

Для розробників open-source ландшафт пропонує найкраще співвідношення якості та ціни. GigaAM v3 (Sber, ліцензія MIT) — беззаперечний лідер для транскрибації виключно російської: end-to-end моделі з пунктуацією і нормалізацією тексту, навчені на 700 000 годин російського мовлення. Python API простий: встановити gigaam, завантажити модель, викликати transcribe(). Обмеження — тільки російська, без мультимовності, і поки що немає GUI-додатків.

Vosk (ліцензія Apache 2.0) — найкращий вибір для офлайн та edge-пристроїв. Російська модель досягає 11% WER навіть на Raspberry Pi — мала модель лише ~50 МБ. Прив'язки для Python, Java, C#, JavaScript, Go і Rust, плюс SDK для Android та iOS. Особлива сила — аудіокниги і чисте мовлення, де досягається вражаючих 1,2% WER.

Whisper та його похідні пропонують найкращу мультимовну гнучкість. Хоча точність російської (~16% WER) поступається GigaAM і Vosk, він підтримує 99 мов і породив багату екосистему інструментів. faster-whisper працює ~4x швидше з ідентичною точністю на INT8/FP16. whisper.cpp дозволяє працювати лише на CPU на Apple Silicon, x86 і мобільних пристроях. WhisperX додає пословні таймстампи й діаризацію через pyannote-audio. Донавчені російські моделі на HuggingFace (antony66/whisper-large-v3-russian) знижують WER з 16,2% до ~6,4%.

Для нетехнічних користувачів найкращі десктопні GUI: Buzz (безкоштовний, кросплатформний, faster-whisper/whisper.cpp, розділення спікерів), MacWhisper ($69 Pro назавжди, пакетна обробка, запис системного аудіо) і Vibe (безкоштовний, простий, ~5 000 зірок на GitHub). Усі працюють офлайн після завантаження моделі.


Мобільні додатки: найкращі варіанти для iOS та Android

На iOS домінують додатки на базі Whisper. Aiko (~$5,99, разова покупка) працює повністю на пристрої — ідеальний для тих, кому важлива приватність. Whisper Notes ($4,99–6,99, разово) додає запис з екрана блокування, користувацький словник і Whisper Large V3 Turbo на Apple Silicon. Whisper Transcription (freemium) пропонує хмарний і on-device режими з AI-самері, рейтинг 4,6+. Just Press Record ($4,99) — найпростіший workflow: один дотик для запису з Apple Watch з автоматичною транскрибацією через iCloud.

На Android лідирує Voice Notebook (безкоштовно з рекламою, Premium) — найкращий додаток для російської диктовки, Google Speech Recognition з офлайн-підтримкою через завантажувані мовні пакети, рейтинг 4,8/5. Speechnotes (безкоштовно, 5М+ завантажень) — запатентована клавіатура для пунктуації без зупинки диктовки. SpeechTexter (безкоштовно, 80+ мов) — простіша альтернатива.

Кросплатформні: Transkriptor (iOS/Android/Web, пробний період, потім ~$4,99/міс) і Notta (iOS/Android/Web, безкоштовно 120 хв/міс при обмеженні 3 хв/розмова) — хмарна транскрибація з діаризацією, хоча якість російської у Notta викликає питання.

ДодатокПлатформаЦінаОфлайнЯкість російської
AikoiOS/Mac~$5,99 разово100%Гарна (Whisper)
Whisper NotesiOS/Mac$4,99–6,99 разово100%Гарна (Whisper)
Whisper TranscriptioniOS/MacFreemiumiPhone 13+Гарна (Whisper)
Voice NotebookAndroidБезкоштовно/PremiumЗ пакетомГарна (Google STT)
SpeechnotesAndroidБезкоштовно/PremiumОбмеженоГарна (Google STT)
Just Press RecordiOS~$4,99 разовоЧастковоСередня

Десктопні додатки: Whisper з людським обличчям

Для тих, кому потрібен простий GUI без командного рядка, виросла ціла екосистема десктопних додатків на базі Whisper. Усі вони працюють офлайн, дані не залишають комп'ютер.

Handy (handy.computer) — безкоштовний open-source додаток для macOS/Windows/Linux з унікальним підходом: push-to-talk диктовка прямо в будь-яке текстове поле. Натиснув гарячу клавішу, сказав, відпустив — текст вставлений в активне вікно. Ідеально для заміни клавіатури при наборі тексту, листуванні та нотатках. Побудований на Whisper, повністю офлайн і приватно.

Vibe (thewh1teagle.github.io/vibe) — одне з найкращих безкоштовних open-source рішень з 5 000+ зірок на GitHub. Кросплатформний (Windows, macOS, Linux), побудований на Tauri + whisper.cpp. Підтримує GPU-прискорення (NVIDIA, AMD, Apple Silicon), 90+ мов, діаризацію спікерів, експорт у SRT/VTT/TXT/DOCX/PDF, транскрибацію YouTube-посилань через yt-dlp, запис з мікрофона, суммаризацію через Claude/Ollama і навіть HTTP API. Найфункціональніший безкоштовний десктоп-клієнт.

Buzz (buzzcaptions.com) — ще один безкоштовний open-source GUI для Whisper. Кросплатформний, підтримує кілька бекендів (whisper.cpp, faster-whisper), розділення спікерів, експорт субтитрів. Мінімалістичніший за Vibe, але стабільний і перевірений.

MacWhisper / Whisper Transcription (App Store) — нативний macOS-додаток з безкоштовною версією (моделі Base і Small) і Pro-підпискою ($8,99/міс або $79,99 назавжди). Pro відкриває моделі Medium і Large, пакетну обробку, запис системного аудіо (Zoom-дзвінки, подкасти), розділення спікерів і Reader Mode. Найполірованіший Whisper-інтерфейс для Mac.

Whisper Notes (whispernotes.app) — $6,99 одноразово для iOS + Mac. 60 000+ користувачів. Ключова фішка — system-wide dictation: затиснув Fn в будь-якому додатку, сказав, відпустив — текст вставлений. Повністю офлайн, використовує Whisper Large V3 Turbo на Apple Silicon.

WhisperDesktop (github.com/Const-me/Whisper) — безкоштовний Windows-додаток з GPU-прискоренням через DirectCompute. Швидший за оригінальний Whisper: 3:24 аудіо обробляються за 19 секунд на GeForce 1080Ti (проти 45 сек у PyTorch+CUDA). Підтримує транскрибацію файлів і запис з мікрофона в реальному часі.

WhisperUI (Microsoft Store) — безкоштовний Windows-додаток з підтримкою GPU через CUDA 11/12 і OpenCL. Повністю офлайн, субтитри в SRT/VTT, пакетна обробка.

Aiko (~$5,99, iOS/Mac) — максимально простий Whisper-додаток для Apple. Drag-and-drop аудіофайлу → текст. Повністю on-device, ідеально для тих, хто хоче транскрибацію однією кнопкою без налаштувань.


Self-hosted рішення: для свого сервера

Для тих, хто хоче розгорнути повноцінний сервіс транскрибації на своєму сервері (або в локальній мережі), є кілька потужних open-source проєктів.

Whishper (github.com/pluja/whishper) — повноцінна self-hosted платформа з веб-інтерфейсом. Включає faster-whisper для транскрибації, LibreTranslate для перекладу субтитрів (60+ мов), вбудований редактор субтитрів, експорт у JSON/TXT/VTT/SRT. Розгортається через Docker Compose. 100% офлайн після встановлення. Чудовий вибір для команд, яким потрібен приватний сервіс транскрибації без хмари.

WhisperLive (github.com/collabora/WhisperLive) — open-source рішення для транскрибації в реальному часі. Працює як сервер з WebSocket-клієнтами: підключаєш мікрофон або файл — отримуєш текст з мінімальною затримкою. Підтримує бекенди faster-whisper, TensorRT і OpenVINO. Підходить для live-транскрибації нарад і конференцій.

WhisperTranscribe (whispertranscribe.com) — хмарний сервіс з безкоштовним тріалом 60 хвилин. Використовує Whisper + AssemblyAI. Окрім транскрибації, генерує 57+ типів контенту з одного запису (пости, самері, маркетингові матеріали). Десктопний Windows-додаток. Підписка від ~$15/міс.


Відеоредактори з вбудованою транскрибацією

Окрема категорія — відеоредактори, які вміють транскрибувати аудіо як частину робочого процесу.

CapCut (ByteDance/TikTok) — безкоштовний відеоредактор з потужною функцією Auto Captions. Підтримує 100+ мов включно з російською. Транскрибує мовлення в субтитри, дозволяє редагувати відео на основі тексту (transcript-based editing), перекладати субтитри між мовами. Веб-версія, десктоп (Windows/Mac), мобільні додатки. Безкоштовно, але орієнтований на субтитри, а не повноцінні транскрипти.

Descript — потужний аудіо/відеоредактор з transcript-based editing (видаляєш слово з тексту — воно вирізається з відео). Проте не підтримує російську — тільки латиниця.

DaVinci Resolve (Blackmagic) — професійний відеоредактор з вбудованою транскрибацією через Whisper. Підтримує російську, але якість поступається спеціалізованим інструментам. Безкоштовна версія доступна.

Subtitle Edit (nikse.dk) — безкоштовний open-source редактор субтитрів для Windows з інтегрованою транскрибацією через Whisper. Підтримує 7 Whisper-рушіїв (OpenAI, Faster-Whisper, CPP, Const-me, WhisperX та ін.), пакетну обробку, переклад, 100+ мов. Найпотужніший безкоштовний інструмент для створення субтитрів з аудіо.


Браузерні розширення та онлайн-інструменти

Transkriptor — доступний як веб-додаток, розширення для Chrome/Firefox, мобільний додаток (iOS/Android). Підтримує російську, автоматична діаризація, експорт у TXT/SRT/DOCX. Безкоштовний тріал, далі $9,99–30/міс. Заявляє 99% точність, але для російської реальна точність нижча.

TurboScribe (turboscribe.ai) — веб-сервіс з 3 безкоштовними транскрибаціями на день (до 30 хв кожна). Російська в списку мов з високою точністю. Платні плани від $10/міс знімають ліміти. Використовує Whisper під капотом.

Wonderscribe — повністю безкоштовний веб-сервіс, але з вищим відсотком помилок (~16% WER). Підходить для чорнової розшифровки, коли точність не критична.

HuggingFace Spaces — OpenAI розмістив безкоштовне Whisper-демо на huggingface.co/spaces/openai/whisper. Завантажуєте файл, отримуєте текст. Безкоштовно, але з обмеженнями за довжиною та чергами.


Нішеві та вузькоспеціалізовані інструменти

Vomo (vomo.ai) — мобільний додаток (iOS/Android) для голосових нотаток з AI-транскрибацією. Орієнтований на personal productivity: записав думку — отримав структуровану нотатку з action items. Підтримує російську.

Subper / SubtitleWhisper (subtitlewhisper.com) — безкоштовний онлайн-генератор субтитрів на Whisper + Silero VAD. Фокус на субтитрах для відеоконтенту. Є онлайн-редактор. Безкоштовний план обмежений, платний від $9,99/міс.

Just Press Record ($4,99, iOS) — мінімалістичний додаток Apple: один дотик для запису з Apple Watch або iPhone, автоматична транскрибація через iCloud. Підтримує російську через Apple Dictation. Ідеально для швидких голосових нотаток.

Voice Notebook (Android, безкоштовно з рекламою) — найкращий Android-додаток для російської диктовки, рейтинг 4,8/5. Використовує Google Speech Recognition з офлайн-підтримкою через завантажувані мовні пакети.

Speechnotes (Android, безкоштовно, 5М+ завантажень) — запатентована клавіатура для пунктуації без зупинки диктовки.


Зведена таблиця: вибір за сценарієм використання

СценарійНайкращий вибірЦінаРосійська
Швидка диктовка в будь-яке полеHandy, Whisper NotesБезкоштовно / $6,99Whisper
Транскрибація файлів офлайнVibe, BuzzБезкоштовноWhisper
macOS полірований GUIMacWhisper Pro$79,99 назавждиWhisper
Windows GPU-прискоренняWhisperDesktop, WhisperUIБезкоштовноWhisper
Максимальна точність RUGigaChat (завантажити аудіо)БезкоштовноGigaAM
Telegram-ботVoxbrief (@VidVKYT2AudioBot)БезкоштовноYouTube, VK
Наради Google Meet/TeamsВбудовані субтитриВ складі підпискиТак
Субтитри для відеоSubtitle Edit + WhisperБезкоштовноWhisper
Відеоредактор + субтитриCapCutБезкоштовноТак
Self-hosted серверWhishperБезкоштовноWhisper
Транскрибація в реальному часіWhisperLiveБезкоштовноWhisper
Людська транскрибаціяGoTranscript$1,20–2,75/хвНосії
Enterprise API (RU-оптимізований)Yandex SpeechKit~₽0,64/хв95-97%
Enterprise API (бюджетний)Tinkoff VoiceKit~₽0,40/хв~95%
Російський сервіс все-в-одномуВойси45 хв безкоштовно98%
Мобільний додаток iOSAiko~$5,99Whisper
Мобільний додаток AndroidVoice NotebookБезкоштовноGoogle STT

Висновок: як обрати відповідний інструмент

Ринок транскрибації для російськомовних користувачів у 2025–2026 більше не страждає від розриву в якості з англійською. Ключовий висновок: архітектура моделі важливіша за назву бренду — інструменти на GigaAM дають майже вдвічі кращу точність для російської, ніж інструменти на Whisper, хоча більшість міжнародних сервісів використовують саме Whisper.

Для звичайних користувачів, яким потрібна транскрибація без налаштування, GigaChat (безкоштовний, веб/Telegram) і Voxbrief (@VidVKYT2AudioBot) (безкоштовний Telegram-бот для вилучення аудіо з відео) — найкращі точки входу. Для професіоналів, яким потрібна регулярна транскрибація нарад, Google Meet і Microsoft Teams нативно підтримують російські субтитри, а Войси і MyMeet.ai додають AI-протоколи нарад. Для максимальної точності на важливих записах — людська транскрибація GoTranscript (99,4%) або Happy Scribe з носіями мови залишаються неперевершеними. Для розробників — GigaAM v3 (MIT, найкраща точність) для російської або Speechmatics/AssemblyAI API для мультимовних завдань.

Головна прогалина — екосистема Apple: російськомовні користувачі на iPhone і Mac не можуть використовувати транскрибацію Voice Memos, Live Captions і функції Apple Intelligence для російської. Поки Apple не розширить мовну підтримку, додатки на базі Whisper — Aiko і Whisper Notes — залишаються найкращою альтернативою, працюючи повністю на пристрої з повною приватністю.

FAQ

Яка модель розпізнавання мовлення найкраще працює з російською?

GigaAM2 від Sber — безумовний лідер із 8,4 % [WER (Word Error Rate)](/uk/blog/word-error-rate-explained) на бенчмарку Alpha Cephei 2025. Для порівняння: [OpenAI Whisper](/uk/blog/openai-whisper-guide) Large V3 показує 16,2 % WER — майже вдвічі гірше. Vosk посідає друге місце з 11,0 % WER.

Чим GigaAM відрізняється від Whisper для російської?

GigaAM навчено на 700 000 годинах російського мовлення й помиляється приблизно в 1 зі 12 слів, тоді як Whisper — в 1 із 6. Головний недолік GigaAM — підтримка лише російської мови, тоді як Whisper працює з 99 мовами та має багату екосистему GUI-додатків.

Який найдешевший enterprise API для транскрибації російської?

Серед російських сервісів найдешевший — Tinkoff VoiceKit за ціною ~₽0,40/хв із точністю ~95 %. Yandex SpeechKit коштує ~₽0,64/хв при точності 95–97 %. Серед міжнародних — Deepgram (~$0,46/год) та AssemblyAI ($0,15–0,27/год).

Чи варто замовляти людську транскрибацію замість ІІ?

Для критично важливих записів — так. GoTranscript забезпечує 99,4 % точності з носіями російської мови за $1,20–2,75/хв. ІІ-транскрибація (8–16 % WER) підходить для більшості завдань, але для юридичних документів, медичних записів і публікацій людська транскрибація надійніша.

Які безкоштовні інструменти транскрибації працюють із російською?

GigaChat від Sber — найкращий безкоштовний варіант без встановлення (веб, Telegram, файли до 2 годин із діаризацією). Для офлайн-роботи — Vibe та Buzz (безкоштовні десктопні GUI на базі Whisper). Онлайн: TurboScribe (3 файли/день по 30 хв) та Any2Text.ru (15 хвилин без реєстрації).