Tüm makaleler

Rusça Konuşan Pazar İçin Transkripsiyon: 2025–2026 Araç Rehberi

·35 dk okuma

Sber'in GigaAM'si Rusça konuşma tanımada baskın konumda; OpenAI'ın Whisper'ını doğruluk açısından neredeyse 2 kat geride bırakırken, GigaChat şaşırtıcı derecede güçlü bir ücretsiz transkripsiyon hizmeti sunuyor. Rusça konuşan kullanıcılar için transkripsiyon pazarı önemli ölçüde olgunlaştı: Rusça üzerine eğitilmiş açık kaynak modelleri artık çoğu ticari çok dilli hizmeti geride bırakıyor; Google Meet ve Microsoft Teams gibi büyük Batılı platformlar Rusça altyazıları tam olarak destekliyor; Yandex SpeechKit, SaluteSpeech ve Voysi gibi büyüyen bir yerli hizmet ekosistemi BDT kitlesine özel olarak tasarlanmış durumda. Apple dikkat çekici bir istisna olmaya devam ediyor — Voice Memos transkripsiyonu hâlâ Rusçayı desteklemiyor. Bu rehber, Rusça konuşan kullanıcılar için mevcut tüm transkripsiyon araç kategorilerini kapsıyor — ücretsiz Telegram botlarından kurumsal API'lere — her biri için Rusça tanıma kalitesinin dürüst bir değerlendirmesiyle birlikte.


Doğruluk Farkı: Neden Model Seçimi Markadan Daha Önemli

Tüm "Rusça desteği" iddiaları eşit değildir. Güvenilir Alpha Cephei 2025 Rusça ASR karşılaştırması, 11 farklı Rusça veri setinde (sesli kitaplar, çağrı merkezleri, TV yayınları, tıbbi konuşma) test edilmiş ve önemli farklılıklar ortaya koymuştur. Sber'in GigaAM2'si %8,4 WER (Kelime Hata Oranı) elde ederek tartışmasız lider konumundadır. Vosk %11,0 WER ile takip ederken, OpenAI Whisper Large V3 %16,2 WER ile geride kalmaktadır — GigaAM'nin yaklaşık iki katı kadar kötü. NVIDIA'nın NeMo Canary V2'si, yeni olmasına rağmen, Rusça'da hayal kırıklığı yaratan %20,2 göstermektedir.

Bu, GigaAM tabanlı bir aracın yaklaşık her 12 kelimeden 1'ini yanlış tanıyacağı, Whisper tabanlı bir aracın ise her 6 kelimeden 1'ini yanlış tanıyacağı anlamına gelir. Temiz konuşmada (sesli kitaplar) tüm modeller iyi performans gösterir (Vosk dikkat çekici bir %1,2 WER elde eder). Gerçek fark, gürültülü ve gerçek dünya seslerinde ortaya çıkar: çağrı merkezi kayıtları, çapraz konuşmalı toplantılar, telefon kalitesinde ses. Burada GigaAM ve Vosk, Whisper'ı önemli ölçüde geride bırakır.

ModelOrtalama WER (Rusça)En İyi Kullanım Alanı
GigaAM2 CTC+LM (Sber)%8,4En iyi genel doğruluk
Vosk 0.54 (Alpha Cephei)%11,0Hafif çevrimdışı/edge
T-one (Tinkoff)%12,8Gerçek zamanlı akış
Whisper Podlodka Turbo%13,8İnce ayarlı Whisper
NeMo FastConformer RU%14,0NVIDIA GPU ekosistemi
Whisper Large V3%16,2Çok dilli genel amaçlı
NeMo Canary V2%20,2AB dil çevirisi

Ücretli Uluslararası Hizmetler: Hangileri Rusça ile Gerçekten Çalışıyor

Düzinelerce büyük ücretli transkripsiyon platformu arasında yalnızca birkaçı gerçekten iyi Rusça desteği sunuyor. Otter.ai ve Descript Rusçayı hiç desteklemiyor — Otter, Rusça seste anlamsız metin üretirken, Descript Latin alfabesi dışındaki tüm dilleri açıkça hariç tutuyor. Notta, 58 dil arasında Rusçayı iddia ediyor ancak 2026'daki bağımsız testler, dil önceden manuel olarak seçilmediğinde tutarsız metin ürettiğini ve seçilse bile kalitenin güvenilmez olduğunu gösterdi.

Rusça için en güçlü ücretli seçenekler iki katmana ayrılıyor. GoTranscript, anadili Rusça olan insan çevirmenlerle %99,4 doğrulukla %100 insan transkripsiyonuyla doğrulukta lider konumda; dakikası $1,20–2,75 fiyatla 1–3 gün teslimat süresi. Happy Scribe hem yapay zekâ (~%85 doğruluk) hem de insan transkripsiyonu (%99 doğruluk, $1,75–2,00/dk) sunuyor; özel bir Rusça dil sayfası ve bölgesel aksan desteği mevcut. Sonix, saat başı $10 şeffaf fiyatlandırması ve %85–99 iddia edilen doğruluğuyla öne çıkıyor.

Geliştiriciler için API hizmetleri önemlidir. Speechmatics, şirket içi dağıtımı destekliyor (veri egemenliği için önemli) ve cömert bir ücretsiz katman sunuyor — ayda 8 saat. AssemblyAI, 99 dilde Universal-2 modelinde Rusçayı kapsıyor; saat başı $0,15–0,27 fiyatla 95 dilde konuşmacı ayırma. Deepgram en düşük API fiyatını (saat başı $0,46) sunuyor ancak karşılaştırmalar Rusça doğruluğunun (%8 WER) rakiplerin biraz gerisinde kaldığını gösteriyor. Maestra en zengin özellikli seçenek: transkripsiyon, DeepL çevirisi, ses klonlamalı yapay zekâ seslendirme ve canlı altyazılar — hepsi Rusça destekli, saat başı $10'dan başlıyor.

HizmetRusça KalitesiFiyatEn İyi Kullanım Alanı
GoTranscriptİnsan, %99,4$1,20–2,75/dkMaksimum doğruluk
Happy ScribeYapay zekâ + insan$17–49/ay + $2/dkHibrit iş akışları
SonixYapay zekâ, %85-99$10/saatŞeffaf yapay zekâ fiyatlandırması
SpeechmaticsAPI$0,30–0,70/saatKurumsal, şirket içi
MaestraHepsi bir arada$10/saat–$359/ayÇok dilli hepsi bir arada
AssemblyAIAPI$0,15–0,27/saatGeliştirici entegrasyonu
TranskriptorBütçe dostu$9,99–30/ayBütçe seçeneği
TrintGazetecilik$52–100/ayGazetecilik iş akışları

Rusça ile Gerçekten Çalışan Ücretsiz Seçenekler

En güçlü ücretsiz araç, yerel olarak kurulan OpenAI Whisper'dır: sınırsız, tamamen gizli, large-v3 modelinde kabul edilebilir Rusça kalitesiyle. Teknik olmayan kullanıcılar masaüstü GUI'leri kullanabilir: Buzz (ücretsiz, çapraz platform, birden fazla arka uç), Vibe (ücretsiz, basit, çevrimdışı) veya MacWhisper (küçük modellerle ücretsiz sürüm; kalıcı Pro için $69). Hepsi model indirildikten sonra çevrimdışı çalışır.

Kurulum gerektirmeyen çevrimiçi transkripsiyon için: TurboScribe — günde 3 ücretsiz transkripsiyon (her biri 30 dakikaya kadar), yüksek doğrulukla dil listesinde Rusça. Speech2Text.ru — konuşmacı ayırmalı 3 ücretsiz saat. Any2Text.ru — kayıt olmadan 15 dakika + kayıtla 60 dakika. Wonderscribe — tamamen ücretsiz ama daha yüksek hata oranıyla (~%16 WER).

Telegram ekosisteminde Voxbrief (@VidVKYT2AudioBot) öne çıkıyor — YouTube ve VK videolarından ses çıkarmak için ücretsiz bir bot: bir bağlantı veya dosya iletin — herhangi bir serviste transkripsiyona hazır bir ses parçası alın. Yerleşik Telegram Premium transkripsiyonu Google Konuşma Tanıma'yı kullanıyor, Rusçayı destekliyor — ücretsiz kullanıcılar haftada 2 transkripsiyon, Premium aboneler sınırsız kullanabiliyor.

Sber'in GigaChat'i özel ilgiyi hak ediyor. 2.0 güncellemesi (Mart 2025) yerel ses işleme ekledi — 2 saate kadar dosya yükleyin ve konuşmacı ayırmalı, akıllı noktalama ve yapay zekâ özeti içeren bir transkripsiyon alın. Web (giga.chat), Telegram botu ve VK MAX üzerinden erişilebilir, abonelik veya VPN gerektirmiyor.


Büyük Teknoloji Platformları: Rusça Transkripsiyon Nerede

Apple, tüm ekosisteminde en kötü Rusça desteğine sahip. Voice Memos transkripsiyonu (iOS 18'de tanıtıldı) yalnızca 10 dili destekliyor — Rusça bunların arasında değil. Live Captions İngilizce ile sınırlı (ABD ve Kanada). Apple Intelligence özellikleri aynı sınırlamalara sahip. Tek olumlu nokta — iOS 8.3'ten (2015) beri Rusçayı destekleyen ve temiz konuşmada makul düzeyde çalışan Siri dikte, ancak kullanıcılar Kiril metinlerinin Latin harflerine dönüşme hataları bildiriyor.

Google en geniş Rusça desteğini sunuyor. Google Meet, Aralık 2022'den beri Rusça altyazıları destekliyor ve şu anda altyazılar için 87 dili, çeviri altyazıları için 69+ dili kapsıyor (ücretli Workspace abonelikleri). Google Docs Sesle Yazma, Rusça ve sesli noktalama komutlarıyla çalışıyor. YouTube, 2012'den beri değişken kalitede (~%60–70) Rusça otomatik altyazılar sunuyor. Google Cloud Speech-to-Text, kurumsal düzeyde Rusça tanıma sağlıyor.

Microsoft, Google ile aynı seviyede. Teams transkripsiyonu ve canlı altyazılar, 60+ dil arasında Rusçayı tam olarak destekliyor; çeviri altyazıları Teams Premium aracılığıyla kullanılabiliyor. Word/Office'te dikte Rusça ile çalışıyor. Azure Speech-to-Text tam Rusça desteği sağlıyor: akış, toplu işleme, özel modeller. Eksik: Windows Voice Access ve Teams'deki yeni AI Interpreter (başlangıçta 9 dil) henüz Rusçayı desteklemiyor.

Zoom otomatik altyazılar (49 dil) ve çeviri altyazıları (36 dil çifti, $5/ay) için Rusçayı destekliyor. Ancak kullanıcılar, çevrilmiş Rusça altyazı kalitesinin "yetersiz" olduğunu belirtiyor — Zoom resmi olarak kalitenin "rakiplerle aynı seviyede veya daha iyi" olduğunu ve sürekli iyileştirildiğini yanıtladı.


Rusya ve BDT Hizmetleri: Ev Sahası Avantajı

Rusya pazarı, özellikle Rusça konuşma kalıpları, aksanlar ve telefon kalitesinde ses üzerine eğitilmiş birkaç güçlü yerli platform ortaya çıkardı.

Yandex SpeechKit, %95–97 iddia edilen doğrulukla ve Alisa'yı destekleyerek kurumsal Rusça konuşma tanımanın altın standardı olmaya devam ediyor. Yalnızca API, tüketici ürünü yok, eşzamanlı tanıma için dakika başı ~₽0,64 fiyatla. SpeechKit Hybrid ile şirket içi dağıtımı destekliyor — veri egemenliği gereksinimleri olan kuruluşlar için kritik. Diller Rusça, İngilizce ve Türkçe ile sınırlı.

Sber SaluteSpeech, bireyler için ayda 100 dakika ücretsiz katmanla (ticari olmayan kullanım) en erişilebilir Rusya kurumsal hizmetidir. Windows ve macOS için masaüstü uygulaması tanıma, sentez ve GigaChat'i birleştiriyor. Kurumsal ürün SaluteSpeech Insights, çağrı merkezi analitiği sağlıyor.

Tinkoff VoiceKit (şimdi T-Bank), terabaytlarca çağrı merkezi verisi üzerinde eğitilmiş dakika başı ~₽0,40–0,45 ile en ucuz Rusya API'sidir. ~%95 doğruluk iddia ediyor ve eğitim kurumları için ücretsiz.

VK Calls, Ağustos 2023'te kendi sinir ağıyla ücretsiz yerleşik transkripsiyon başlattı — zaman damgalı ve konuşmacı etiketli metin, arama sohbetine .txt dosyası olarak gönderiliyor. Şimdilik yalnızca Rusça.

Tüketici odaklı Rusya hizmetleri arasında Voysi öne çıkıyor — %98 iddia edilen doğruluk, 16 çıktı formatı (transkript, toplantı tutanağı, görevler, özet, altyazılar), Telegram, VK ve MAX'ta botlar — ilk kullanımda 45 ücretsiz dakika. Guru Scribe etkileyici hız sunuyor: konuşmacı ayırma olmadan saat başına 27 saniye, 60 ücretsiz dakikayla dakikası ₽4'ten başlıyor. Teamlogs canlı transkripsiyon için doğrudan Zoom, Google Meet ve Yandex Telemost'a bağlanıyor, dakikası ₽6'dan başlıyor. MyMeet.ai, ~%96 doğrulukla toplantı transkripsiyonuna odaklanıyor ve tüm büyük platformlarla entegre oluyor.


Açık Kaynak: GigaAM Hükmediyor ama Whisper'ın Ekosistemi Var

Geliştiriciler için açık kaynak ortamı en iyi fiyat-performans oranını sunuyor. GigaAM v3 (Sber, MIT lisansı), yalnızca Rusça transkripsiyon için tartışmasız lider: noktalama ve metin normalizasyonlu uçtan uca modeller, 700.000 saat Rusça konuşma üzerinde eğitilmiş. Python API basittir: gigaam'ı kurun, modeli yükleyin, transcribe()'ı çağırın. Sınırlama — yalnızca Rusça, çok dil desteği yok ve henüz GUI uygulaması yok.

Vosk (Apache 2.0 lisansı), çevrimdışı ve edge cihazlar için en iyi seçenektir. Rusça modeli Raspberry Pi'de bile %11 WER elde ediyor — küçük model yalnızca ~50 MB. Python, Java, C#, JavaScript, Go ve Rust bağlamaları, artı Android ve iOS SDK'ları. Özel gücü sesli kitaplar ve temiz konuşma; burada dikkat çekici %1,2 WER elde ediyor.

Whisper ve türevleri en iyi çok dilli esnekliği sunuyor. Rusça doğruluğu (~%16 WER) GigaAM ve Vosk'un gerisinde kalsa da, 99 dili destekliyor ve zengin bir araç ekosistemi doğurdu. faster-whisper, INT8/FP16'da aynı doğrulukla ~4 kat daha hızlı çalışıyor. whisper.cpp, Apple Silicon, x86 ve mobil cihazlarda yalnızca CPU ile çalışmayı sağlıyor. WhisperX, pyannote-audio aracılığıyla kelime düzeyinde zaman damgaları ve konuşmacı ayırma ekliyor. HuggingFace'teki ince ayarlı Rusça modeller (antony66/whisper-large-v3-russian) WER'i %16,2'den ~%6,4'e düşürüyor.

Teknik olmayan kullanıcılar için en iyi masaüstü GUI'ler: Buzz (ücretsiz, çapraz platform, faster-whisper/whisper.cpp, konuşmacı ayırma), MacWhisper (kalıcı Pro $69, toplu işleme, sistem ses kaydı) ve Vibe (ücretsiz, basit, ~5.000 GitHub yıldızı). Hepsi model indirildikten sonra çevrimdışı çalışır.


Mobil Uygulamalar: iOS ve Android İçin En İyi Seçenekler

iOS'ta Whisper tabanlı uygulamalar baskın konumda. Aiko (~$5,99, tek seferlik satın alma) tamamen cihaz üzerinde çalışır — gizliliğe önem verenler için ideal. Whisper Notes ($4,99–6,99, tek seferlik) kilit ekranından kayıt, özel sözlük ve Apple Silicon'da Whisper Large V3 Turbo ekliyor. Whisper Transcription (freemium), yapay zekâ özetleriyle bulut ve cihaz üstü modlar sunuyor, 4,6+ puan. Just Press Record ($4,99), en basit iş akışını sunuyor: Apple Watch'tan tek dokunuşla kayıt ve iCloud üzerinden otomatik transkripsiyon.

Android'de Voice Notebook (reklamlı ücretsiz, Premium) lider — Rusça dikte için en iyi uygulama, indirilebilir dil paketleriyle çevrimdışı destekli Google Konuşma Tanıma, 4,8/5 puan. Speechnotes (ücretsiz, 5M+ indirme) dikteyi durdurmadan noktalama için patentli klavye sunuyor. SpeechTexter (ücretsiz, 80+ dil) daha basit bir alternatif.

Çapraz platform: Transkriptor (iOS/Android/Web, deneme süresi, sonra ~$4,99/ay) ve Notta (iOS/Android/Web, konuşma başına 3 dakika sınırıyla ayda 120 dakika ücretsiz) — konuşmacı ayırmalı bulut transkripsiyon, ancak Notta'nın Rusça kalitesi sorgulanabilir.

UygulamaPlatformFiyatÇevrimdışıRusça Kalitesi
AikoiOS/Mac~$5,99 tek seferlik%100İyi (Whisper)
Whisper NotesiOS/Mac$4,99–6,99 tek seferlik%100İyi (Whisper)
Whisper TranscriptioniOS/MacFreemiumiPhone 13+İyi (Whisper)
Voice NotebookAndroidÜcretsiz/PremiumPaketleİyi (Google STT)
SpeechnotesAndroidÜcretsiz/PremiumSınırlıİyi (Google STT)
Just Press RecordiOS~$4,99 tek seferlikKısmenOrta

Masaüstü Uygulamalar: İnsan Yüzlü Whisper

Komut satırı olmadan basit bir GUI'ye ihtiyaç duyanlar için Whisper tabanlı masaüstü uygulamalarından oluşan bütün bir ekosistem oluştu. Hepsi çevrimdışı çalışır, veriler bilgisayarınızdan çıkmaz.

Handy (handy.computer) — benzersiz bir yaklaşıma sahip macOS/Windows/Linux için ücretsiz açık kaynak uygulama: doğrudan herhangi bir metin alanına bas-konuş dikte. Kısayol tuşuna basın, konuşun, bırakın — metin aktif pencereye eklenir. Yazma, mesajlaşma ve not alma sırasında klavye yerine kullanmak için mükemmel. Whisper üzerine kurulu, tamamen çevrimdışı ve gizli.

Vibe (thewh1teagle.github.io/vibe) — 5.000+ GitHub yıldızıyla en iyi ücretsiz açık kaynak çözümlerden biri. Çapraz platform (Windows, macOS, Linux), Tauri + whisper.cpp üzerine kurulu. GPU hızlandırma (NVIDIA, AMD, Apple Silicon), 90+ dil, konuşmacı ayırma, SRT/VTT/TXT/DOCX/PDF'ye dışa aktarma, yt-dlp ile YouTube bağlantısı transkripsiyonu, mikrofon kaydı, Claude/Ollama ile özetleme ve hatta HTTP API destekliyor. En zengin özellikli ücretsiz masaüstü istemci.

Buzz (buzzcaptions.com) — Whisper için bir başka ücretsiz açık kaynak GUI. Çapraz platform, birden fazla arka ucu destekler (whisper.cpp, faster-whisper), konuşmacı ayırma, altyazı dışa aktarma. Vibe'dan daha minimalist ama kararlı ve kanıtlanmış.

MacWhisper / Whisper Transcription (App Store) — ücretsiz sürümle (Base ve Small modelleri) ve Pro aboneliğiyle ($8,99/ay veya $79,99 kalıcı) yerel macOS uygulaması. Pro, Medium ve Large modelleri, toplu işleme, sistem ses kaydı (Zoom aramaları, podcast'ler), konuşmacı ayırma ve Reader Mode'u açar. Mac için en cilalı Whisper arayüzü.

Whisper Notes (whispernotes.app) — iOS + Mac için $6,99 tek seferlik. 60.000+ kullanıcı. Temel özellik — sistem genelinde dikte: herhangi bir uygulamada Fn'yi basılı tutun, konuşun, bırakın — metin eklenir. Tamamen çevrimdışı, Apple Silicon'da Whisper Large V3 Turbo kullanır.

WhisperDesktop (github.com/Const-me/Whisper) — DirectCompute ile GPU hızlandırmalı ücretsiz Windows uygulaması. Orijinal Whisper'dan daha hızlı: 3:24 ses GeForce 1080Ti'de 19 saniyede işlenir (PyTorch+CUDA ile 45 saniyeye karşı). Dosya transkripsiyonu ve gerçek zamanlı mikrofon kaydını destekler.

WhisperUI (Microsoft Store) — CUDA 11/12 ve OpenCL ile GPU destekli ücretsiz Windows uygulaması. Tamamen çevrimdışı, SRT/VTT'de altyazılar, toplu işleme.

Aiko (~$5,99, iOS/Mac) — Apple için en basit Whisper uygulaması. Ses dosyasını sürükle-bırak → metin. Tamamen cihaz üstü, ayar yapmadan tek tuşla transkripsiyon isteyenler için ideal.


Self-Hosted Çözümler: Kendi Sunucunuz İçin

Kendi sunucusunda (veya yerel ağda) tam teşekküllü bir transkripsiyon hizmeti kurmak isteyenler için birkaç güçlü açık kaynak proje var.

Whishper (github.com/pluja/whishper) — web arayüzlü eksiksiz bir self-hosted platform. Transkripsiyon için faster-whisper, altyazı çevirisi için LibreTranslate (60+ dil), yerleşik altyazı düzenleyici, JSON/TXT/VTT/SRT'ye dışa aktarma içerir. Docker Compose ile kurulur. Kurulumdan sonra %100 çevrimdışı. Bulut olmadan özel transkripsiyon hizmetine ihtiyaç duyan ekipler için mükemmel bir seçim.

WhisperLive (github.com/collabora/WhisperLive) — gerçek zamanlı transkripsiyon için açık kaynak çözüm. WebSocket istemcileriyle bir sunucu olarak çalışır: mikrofon veya dosya bağlayın — minimum gecikmeyle metin alın. faster-whisper, TensorRT ve OpenVINO arka uçlarını destekler. Toplantıların ve konferansların canlı transkripsiyonu için uygundur.

WhisperTranscribe (whispertranscribe.com) — 60 dakikalık ücretsiz deneme süresine sahip bulut hizmeti. Whisper + AssemblyAI kullanır. Transkripsiyonun ötesinde, tek bir kayıttan 57+ içerik türü üretir (gönderiler, özetler, pazarlama materyalleri). Masaüstü Windows uygulaması. Abonelik ~$15/ay'dan başlıyor.


Yerleşik Transkripsiyonlu Video Düzenleyiciler

Ayrı bir kategori — ses transkripsiyonunu iş akışının bir parçası olarak yapabilen video düzenleyiciler.

CapCut (ByteDance/TikTok) — güçlü Otomatik Altyazı işlevine sahip ücretsiz video düzenleyici. Rusça dahil 100+ dili destekler. Konuşmayı altyazılara dönüştürür, metin tabanlı video düzenlemeye izin verir, diller arası altyazı çevirisi yapar. Web sürümü, masaüstü (Windows/Mac), mobil uygulamalar. Ücretsiz, ancak tam transkriptlerden ziyade altyazılara yönelik.

Descript — metin tabanlı düzenleme özellikli güçlü ses/video düzenleyici (metinden bir kelime silin — videodan kesilir). Ancak Rusçayı desteklemiyor — yalnızca Latin alfabesi.

DaVinci Resolve (Blackmagic) — Whisper ile yerleşik transkripsiyonlu profesyonel video düzenleyici. Rusçayı destekler ancak kalite uzman araçların gerisinde kalır. Ücretsiz sürüm mevcut.

Subtitle Edit (nikse.dk) — Whisper ile entegre transkripsiyonlu Windows için ücretsiz açık kaynak altyazı düzenleyici. 7 Whisper motorunu (OpenAI, Faster-Whisper, CPP, Const-me, WhisperX ve diğerleri), toplu işleme, çeviri, 100+ dili destekler. Sesten altyazı oluşturmak için en güçlü ücretsiz araç.


Tarayıcı Uzantıları ve Çevrimiçi Araçlar

Transkriptor — web uygulaması, Chrome/Firefox uzantısı ve mobil uygulama (iOS/Android) olarak mevcut. Rusçayı destekler, otomatik konuşmacı ayırma, TXT/SRT/DOCX'e dışa aktarma. Ücretsiz deneme, sonra $9,99–30/ay. %99 doğruluk iddia ediyor ancak Rusça için gerçek doğruluk daha düşük.

TurboScribe (turboscribe.ai) — günde 3 ücretsiz transkripsiyon (her biri 30 dakikaya kadar) sunan web hizmeti. Yüksek doğrulukla dil listesinde Rusça. Ücretli planlar $10/ay'dan başlayarak limitleri kaldırır. Perde arkasında Whisper kullanır.

Wonderscribe — tamamen ücretsiz web hizmeti, ancak daha yüksek hata oranıyla (~%16 WER). Doğruluğun kritik olmadığı taslak çözümler için uygundur.

HuggingFace Spaces — OpenAI, huggingface.co/spaces/openai/whisper adresinde ücretsiz bir Whisper demosu barındırdı. Dosya yükleyin, metin alın. Ücretsiz, ancak uzunluk sınırlamaları ve kuyruklar var.


Niş ve Özelleşmiş Araçlar

Vomo (vomo.ai) — yapay zekâ transkripsiyonlu sesli notlar için mobil uygulama (iOS/Android). Kişisel üretkenliğe yönelik: bir düşünce kaydedin — eylem maddeleriyle yapılandırılmış bir not alın. Rusçayı destekler.

Subper / SubtitleWhisper (subtitlewhisper.com) — Whisper + Silero VAD kullanan ücretsiz çevrimiçi altyazı oluşturucu. Video içeriği için altyazılara odaklı. Çevrimiçi düzenleyici var. Ücretsiz plan sınırlı, ücretli $9,99/ay'dan başlıyor.

Just Press Record ($4,99, iOS) — minimalist Apple uygulaması: Apple Watch veya iPhone'dan tek dokunuşla kayıt, iCloud üzerinden otomatik transkripsiyon. Apple Dikte aracılığıyla Rusçayı destekler. Hızlı sesli notlar için ideal.

Voice Notebook (Android, reklamlı ücretsiz) — Rusça dikte için en iyi Android uygulaması, 4,8/5 puan. İndirilebilir dil paketleriyle çevrimdışı destekli Google Konuşma Tanıma kullanır.

Speechnotes (Android, ücretsiz, 5M+ indirme) — dikteyi durdurmadan noktalama için patentli klavye.


Özet Tablo: Kullanım Senaryosuna Göre Seçim

Kullanım SenaryosuEn İyi SeçimFiyatRusça
Herhangi bir alana hızlı dikteHandy, Whisper NotesÜcretsiz / $6,99Whisper
Çevrimdışı dosya transkripsiyonuVibe, BuzzÜcretsizWhisper
macOS cilalı GUIMacWhisper ProKalıcı $79,99Whisper
Windows GPU hızlandırmaWhisperDesktop, WhisperUIÜcretsizWhisper
Maksimum RU doğruluğuGigaChat (ses yükle)ÜcretsizGigaAM
Telegram botuVoxbrief (@VidVKYT2AudioBot)ÜcretsizYouTube, VK
Google Meet/Teams toplantılarıYerleşik altyazılarAbonelik dahilindeEvet
Video için altyazılarSubtitle Edit + WhisperÜcretsizWhisper
Video düzenleyici + altyazılarCapCutÜcretsizEvet
Self-hosted sunucuWhishperÜcretsizWhisper
Gerçek zamanlı transkripsiyonWhisperLiveÜcretsizWhisper
İnsan transkripsiyonuGoTranscript$1,20–2,75/dkAnadili konuşanlar
Kurumsal API (RU-optimize)Yandex SpeechKit~₽0,64/dk%95-97
Kurumsal API (bütçe dostu)Tinkoff VoiceKit~₽0,40/dk~%95
Rusça hepsi bir arada hizmetVoysi45 dk ücretsiz%98
Mobil uygulama iOSAiko~$5,99Whisper
Mobil uygulama AndroidVoice NotebookÜcretsizGoogle STT

Sonuç: Doğru Aracı Nasıl Seçersiniz

2025–2026'da Rusça konuşan kullanıcılar için transkripsiyon pazarı artık İngilizce ile arasında kalite farkından muzdarip değil. Temel çıkarım: model mimarisi marka adından daha önemlidir — GigaAM tabanlı araçlar, çoğu uluslararası hizmet Whisper kullansa da, Rusça için Whisper tabanlı araçlara göre neredeyse iki kat daha iyi doğruluk sunuyor.

Kurulum gerektirmeyen transkripsiyon isteyen günlük kullanıcılar için GigaChat (ücretsiz, web/Telegram) ve Voxbrief (@VidVKYT2AudioBot) (videodan ses çıkarma için ücretsiz Telegram botu) en iyi giriş noktaları. Düzenli toplantı transkripsiyonuna ihtiyaç duyan profesyoneller için Google Meet ve Microsoft Teams yerel olarak Rusça altyazıları destekliyor; Voysi ve MyMeet.ai ise yapay zekâ toplantı tutanakları ekliyor. Önemli kayıtlarda maksimum doğruluk için GoTranscript'in insan transkripsiyonu (%99,4) veya anadili konuşanlarla Happy Scribe rakipsiz kalıyor. Geliştiriciler için — Rusça için GigaAM v3 (MIT, en iyi doğruluk) veya çok dilli görevler için Speechmatics/AssemblyAI API'leri.

Ana eksiklik Apple ekosistemi: iPhone ve Mac'teki Rusça konuşan kullanıcılar Voice Memos transkripsiyonu, Live Captions ve Apple Intelligence özelliklerini Rusça için kullanamıyor. Apple dil desteğini genişletene kadar, Whisper tabanlı uygulamalar — Aiko ve Whisper Notes — tam gizlilikle tamamen cihaz üzerinde çalışarak en iyi alternatif olmaya devam ediyor.

FAQ

Rusça ile en iyi çalışan konuşma tanıma modeli hangisi?

Sber'in GigaAM2'si Alpha Cephei 2025 karşılaştırmasında %8,4 [WER (Kelime Hata Oranı)](/tr/blog/word-error-rate-explained) ile tartışmasız lider. Karşılaştırma olarak, [OpenAI Whisper](/tr/blog/openai-whisper-guide) Large V3'ü %16,2 WER gösteriyor — neredeyse iki kat daha kötü. Vosk %11,0 WER ile ikinci sırada.

Rusça için GigaAM ile Whisper arasındaki fark nedir?

GigaAM 700.000 saat Rusça konuşma ile eğitilmiştir ve yaklaşık her 12 kelimede 1 hata yapar; Whisper ise her 6 kelimede 1. GigaAM'in ana dezavantajı yalnızca Rusça'yı desteklemesidir; Whisper ise 99 dilde çalışır ve zengin bir GUI uygulama ekosistemine sahiptir.

Rusça transkripsiyon için en ucuz kurumsal API hangisi?

Rus hizmetleri arasında en ucuzu ~₽0,40/dk fiyat ve ~%95 doğrulukla Tinkoff VoiceKit'tir. Yandex SpeechKit ~₽0,64/dk fiyatla %95–97 doğruluk sunar. Uluslararası seçenekler arasında Deepgram (~$0,46/saat) ve AssemblyAI ($0,15–0,27/saat) öne çıkar.

Yapay zekâ yerine insan transkripsiyonu tercih etmeye değer mi?

Kritik öneme sahip kayıtlar için — evet. GoTranscript, anadili Rusça olan konuşmacılarla $1,20–2,75/dk fiyatla %99,4 doğruluk sağlar. Yapay zekâ transkripsiyonu (%8–16 WER) çoğu görev için uygundur, ancak hukuki belgeler, tıbbi kayıtlar ve yayınlar için insan transkripsiyonu daha güvenilirdir.

Rusça ile çalışan ücretsiz transkripsiyon araçları hangileri?

Sber'in GigaChat'i kurulum gerektirmeyen en iyi ücretsiz seçenektir (web, Telegram, diarizasyonlu 2 saate kadar dosyalar). Çevrimdışı çalışma için Vibe ve Buzz (Whisper tabanlı ücretsiz masaüstü GUI'ler). Çevrimiçi: TurboScribe (günde 3 dosya, 30 dk) ve Any2Text.ru (kayıt olmadan 15 dakika).