Bu hujjat ommaviy emas. Taklifnomadagi parolni kiriting.
Demo uchun maslahat:subtle2026
Dunyo kontenti — rus/ingliz tilida. Dunyo auditoriyasi — yo‘q. Biz live-tarjimani istalgan narsa ustiga qo‘yamiz va eng og‘riydigan, gigantlar bormaydigan bozordan boshlaymiz.
Toshkentdagi talaba ruscha ma’ruzaning 30%ini yo‘qotadi. OS-dagi live-captions — faqat ingliz va faqat bitta ilova ichida. DeepL o‘zbek tilini bilmaydi.
Mintaqadagi onlayn-kontentning 20–40%i rus tilida, yosh auditoriya esa o‘zbek/qozoq tilida o‘ylaydi. Ta’lim allaqachon milliy tilda, kasbiy kontent — yo‘q.
Otter — EN, bulut, faqat qo‘ng‘iroqda. Apple Live Captions — EN, faqat FaceTime/Phone’da. Verbit/3Play — yiliga $33k turadigan xizmatlar. OSS (LocalVocal) — NLLB sifati, yomon UX.
Eshitishi pasaygan 1.5 mlrd kishi; MDHda tizim subtitrlari faqat inglizcha — xizmat ko‘rsatilmagan butun bozor.
Desktop-ilova: har qanday audioni olish (mikrofon yoki tizim ovozi) → striming Whisper (Apple MLX orqali lokal yoki bulutda) → Gemini 2.5 orqali tarjima → barcha oynalar ustida ixcham overlay. Ikki bosqichli uzatish: bir zumda gipoteza → tasdiqlangan matn (LocalAgreement-2). Ishlaydigan prototip, ~2.5s kechikish, real ruscha vebinar nutqi → o‘zbekka validatsiya qilingan.
Platforma plagini emas. Desktop-ilovaga, lokal videoga, istalgan messenjerdagi qo‘ng‘iroqqa subtitr qo‘yadi.
Soha atamalari va ismlar Whisper prompt’ida → atoqli otlarni keskin yaxshi taniydi (validatsiya: «питоне» → «Python»).
Har bir sessiyaning audio + transkripti yoziladi — soha ASR’ini fine-tune qilish uchun data flywheel.
OpenAI Realtime / gpt-realtime-whisper (<1s finalizatsiya); MLX Whisper-large-v3-turbo’ni Apple Silicon’da maqbul kechikishda ishlatadi → maxfiylik + ~$0 marjinal narx.
Gemini 2.5 o‘zb/qoz/toj tillarida — DeepL’da umuman yo‘q, NLLB esa fine-tune talab qiladigan suhbat sifati.
O‘zbekiston «til bo‘yicha maslahatchi» lavozimini joriy qilmoqda (yan 2026), lotin yozuviga o‘tishni tezlashtirmoqda; Qozog‘iston — ta’limda milliy til. RU/EN→UZ/KZ vositalariga tarkibiy talab.
Kontent va auditoriya tili mos kelmasligi — moda emas, tarkibiy holat.
Global — speech-to-text bozori → 2030ga $26.2B (CAGR ~15.6%); captioning & subtitling solutions ~$2.5B (2024). Pastdan yuqoriga: 200M manzilli × $3/oy ≈ $7.2B/yil nazariy; bugun real egallanadigan consumer-soft bo‘lagi ≈ $2–6B/yil.
Beachhead: O‘zbekiston/MO. Customer zero — Mars IT School (2 300 talaba, 126 mentor, 7 filial): nol CAC, real validatsiya xonasi, gigantlar low-resource’ga bormaydi. customer zero tayyor
Klient Gemini’ga to‘g‘ridan-to‘g‘ri murojaat qiladi; bulut ASR — foydalanuvchi kaliti orqali (BYOK). Server burn = $0. Doimiy xarajatlar ≈ $33/oy. Bu past narxda unit-iqtisodni sog‘lom ushlaydi.
Roadmap: M1 — v1 + Windows + bulut <1s; M2 — 3 EDU-pilot + ommaviy lonch + 1K free; M3 — 10K free / 500 Pro / $10–20K MRR; 6 oy — fine-tuned soha ASR + klient glossariylar + LMS/Zoom-plaginlar.
Lokal ASR = $0 marjinal; Gemini faqat tarjima uchun ≈ $0.0005/min (~$0.60/oy 20 soatda). Bulut ASR ($0.06/min) — faqat BYOK sifatida, narx foydalanuvchiga tushishi uchun. To‘lovlar: o‘z sayti orqali (Stripe), App Store emas — $5dan $4.55 qoladi, App Store 30%da $3.50 o‘rniga.
Lokal Whisper, 1 juftlik, vaqt limitsiz, yengil watermark. COGS ≈ $0.30/oy.
Barcha tillar, bulut <1s (BYOK), watermarksiz, eksport, sinxronlash. Gross profit ≈ $3.95/foydalanuvchi (85%).
SSO, umumiy lug‘atlar, on-prem, universitet/sinf litsenziyasi. Yuqori ARPU, hamkorliklar orqali past CAC.
| Stsenariy | Sof daromad/foydalanuvchi | COGS (20s/oy) | Gross profit | $1K/oy sof uchun foydalanuvchi |
|---|---|---|---|---|
| $3/oy, lokal ASR, Stripe | $2.61 | $0.60 | $2.01 (77%) | ~513 |
| $3/oy, App Store 30% | $2.10 | $0.60 | $1.50 | ~689 |
| $5/oy, lokal ASR, Stripe | $4.55 | $0.60 | $3.95 (85%) | ~261 |
| $3/oy + foydalanuvchi bulut ASR yoqadi | $2.61 | $72.60 | −$70 — taklif qilinmasin | — |
Asoschi maqsadi bo‘yicha xulosa: «1000 × $3» = ~$1,977/oy sof — erishsa bo‘ladi, lekin yostiq yupqa. «1000 × $5» = ~$4,000/oy sof — tavsiya etiladigan model. $3 — ishga tushirish promo-narxi.
Organika CAC ≈ $0 (asoschi vaqti). Pullik (X Ads, YT pre-roll) — faqat akselerator: CAC $3–8, LTV ≈ $40, LTV/CAC ~5–13×. Tor joy — yaxshi demo-kliplar soni va sharhlarga tushish, pul emas.
| Vosita | Tarjima | O‘zb/qoz/toj | Har qanday ilova ustida | Lokal |
|---|---|---|---|---|
| Otter.ai | yo‘q (EN) | yo‘q | faqat qo‘ng‘iroqda | yo‘q |
| Apple Live Captions | EN→IT/JA/KO/ZH | yo‘q | tarjima faqat FaceTime/Phone’da | ha (EN) |
| MS Windows Live Captions | yirik tillar | yo‘q | suzuvchi oyna (Win) | ha |
| Verbit / 3Play | ha | qisman | xizmat, vosita emas | yo‘q |
| DeepL / NLLB | ha | yo‘q / kuchsiz | live emas | — |
| Subtle | LLM sifati | ha | ekrandagi har qanday audio | ha |
(a) o‘z ekotizimlari/ilovalarida qulflangan, overlay-anything emas; (b) EN + top-10 tilni ustun ko‘radi, o‘zb/qoz/toj/qirg‘izni tarkibiy e’tiborsiz qoldiradi; (c) soha glossariylari / per-customer fine-tune yo‘q.
Overlay-anything + kam resursli tillarda sifat + on-device maxfiylik + data flywheel: yozilgan sessiyalar → fine-tuned soha ASR (dasturlash/biznes/tibbiyot) + klient glossariylar → «sovuqdan» takrorlab bo‘lmaydigan aniqlik.
Istalgan ekrandagi istalgan ovoz — sizning tilingizda tushunarli.
Markaziy Osiyodan boshlaymiz. Dvigatel — butun ingliz tilini bilmaydigan dunyo uchun.