AI kuris kalba lietuviškai — kaip tai sukūrėme
Trumpai
Lietuvių kalba — viena seniausių ir gramatiškai sudėtingiausių gyvų kalbų Europoje. Septyni linksniai, sudėtingos linksniuotės, laisva žodžių tvarka ir labai mažas globalus duomenų kiekis daro ją tikru iššūkiu AI platformoms. Kai globalus balso AI bando kalbėti lietuviškai, jis sudarko vardus, naudoja neteisingus linksnius ir skamba robotiškai. Mes mėnesius dirbome su kalbininkais, tobulinome tarimo modelius ir kūrėme lietuvių kalbos kokybės vertinimo sistemas. Tai AINORA istorija — kaip sukūrėme AI, kuris kalba lietuviškai taip, kaip kalba lietuviai.
Kai pirmą kartą išgirdau, kaip mūsų AI teisingai sulinksnavo lietuvišką pavardę šauksmininke — kreipėsi į skambinantįjį „Sveiki, Jonai" vietoj gramatiškai neteisingos „Sveiki, Jonas" — supratau, kad esame teisingame kelyje. Tas vienas balsių pakeitimas žodžio gale, kurį beveik visos globalios AI platformos suklysta kiekvieną kartą, atspindėjo mėnesių darbą. Ir tai buvo tik pradžia.
Tai pasakojimas apie tai, kodėl sukūrėme AINORA, kaip sprendėme milžinišką iššūkį — priversti AI kalbėti lietuviškai natūraliai — ir ko išmokome šiame kelyje. Tai istorija apie kalbą, technologijas ir tvirtą įsitikinimą, kad trys milijonai lietuviškai kalbančių žmonių nusipelno AI, kuris juos iš tiesų supranta.
Kodėl lietuvių kalba tokia sunki AI?
Jei skaitote tekstus angliškai, esate pripratę prie kalbos, kurioje žodžiai beveik nesikeičia. „John" visada yra „John" — nesvarbu, ar kalbate su juo, apie jį, ar jam ką nors duodate. Lietuvių kalba taip neveikia. Net iš tolo.
Lietuvių kalba yra viena archajiškiausių gyvų indoeuropiečių kalbų. Kalbininkai ją studijuoja norėdami suprasti, kaip skambėjo senovinės kalbos prieš tūkstančius metų. AI inžinieriams šis senovinis paveldas reiškia labai konkrečių iššūkių rinkinį:
Septyni linksniai
Kiekvienas lietuviškas daiktavardis, būdvardis ir įvardis keičia formą priklausomai nuo funkcijos sakinyje. Vien vardas „Jonas" turi septynias formas: Jonas (vardininkas), Jono (kilmininkas), Jonui (naudininkas), Joną (galininkas), Jonu (įnagininkas), Jonuje (vietininkas), Jonai (šauksmininkas). Kiekviena forma signalizuoja skirtingą gramatinę funkciją. Suklydęs su linksniu, AI skamba kaip užsienietis, išmokęs lietuvių kalbą iš vadovėlio — arba dar blogiau, kaip mašina.
Balso AI, kuris turi pasveikinti skambinančiuosius vardu, tai yra kritiška. Kai skambina klientas vardu Jonas, AI privalo sakyti „Sveiki, Jonai" (šauksmininkas), ne „Sveiki, Jonas" (vardininkas). Kai kalbama apie Joną su kolega, reikia sakyti „Jono vizitas" (kilmininkas). Tai ne pasirinkimas — tai bazinė gramatika, kurią kiekvienas lietuvis įsisavina iki penkerių metų.
Sudėtingos linksniuotės
Neužtenka žinoti, kad vardai kinta. Reikia žinoti, kaip jie kinta, o lietuvių kalboje yra kelios linksniuočių grupės. „Jonas" šauksmininke tampa „Jonai", bet „Petras" — „Petrai". „Kazys" — „Kazy". „Giedrius" — „Giedriau". Moteriški vardai laikosi visiškai kitokių taisyklių: „Ona" lieka „Ona", „Rasa" — „Rasa", bet „Jurgita" — „Jurgita". O pavardės: „Butkus" šauksmininke tampa „Butkau", „Petrauskienė" — „Petrauskiene".
Dabar padauginkite tai iš kiekvieno daiktavardžio kalboje — ne tik vardų, bet ir vietovių, paslaugų, laiko posakių ir viso kito, kas pasirodo verslo telefono pokalbyje. Kombinacinis sudėtingumas yra milžiniškas.
Formalus ir neformalus registras
Lietuvių kalboje yra griežtas skirtumas tarp formalaus („jūs") ir neformalaus („tu") kreipimosi. Verslo AI privalo visada naudoti formalų registrą su klientais — bet šis formalus registras paveikia veiksmažodžių asmenuotes, įvardžius ir net kai kurias daiktavardžių formas visuose sakiniuose. Vienas paslydimas į neformalų registrą gali skambėti šiurkščiai arba neprofesionaliai.
Tarimas ir intonacija
Lietuvių kalba turi toninį kirtį — tas pats skiemuo gali būti tariamas kylančia arba krentančia intonacija, keičiančia reikšmę. Miestų pavadinimai — „Vilnius", „Kaunas", „Šiauliai" — turi specifines kirčiavimo taisykles. Lietuviškos pavardės kirčiuojamos skirtinguose skiemenyse priklausomai nuo linksniuotės klasės. Neteisingai ištartas kliento vardas iš karto pakerta pasitikėjimą.
Mažas globalus duomenų rinkinys
Štai fundamentali problema: šiuolaikiniai neuroniniai kalbos modeliai mokosi iš duomenų. Anglų kalba turi milijardus valandų mokymo duomenų. Lietuvių kalba — tik mažą dalį to. Su maždaug trimis milijonais gimtakalbių ir ribotu skaitmeniniu turiniu, palyginti su pagrindinėmis pasaulio kalbomis, lietuvių kalba AI tyrinėtojams yra „mažo resurso kalba". Globalios platformos pirmiausia treniruojamos anglų kalba ir dešimčia didžiausių pasaulio kalbų. Lietuvių kalba — antras planas, jei apskritai palaikoma.
Problema, kurią nusprendėme spręsti
2025-aisiais, kai pradėjau tyrinėti balso AI galimybes Lietuvos verslui, išbandžiau visas pagrindines platformas, kurias galėjau rasti. Rezultatai, diplomatiškai tariant, nebuvo paruošti produkcijai.
Paskambinau į vienos žinomos globalios balso AI platformos demonstracinę liniją ir pabandžiau bendrauti lietuviškai. Ji suprato gal 60% to, ką pasakiau. Kai bandė kalbėti lietuviškai atgal, tai skambėjo kaip žmogus, skaitantis lietuvišką tekstą su anglišku akcentu — kirčiai ne tose vietose, balsiai suplokštinti, linksniai sujaukti. Mane vadino „Justas", kai turėjo sakyti „Justai". „Vilnių" ištarė kaip kažką panašaus į „Vil-ni-us" vietoj teisingo „Vil-nius" su minkštu „l".
Viešbučiui, bandančiam padaryti įspūdį svečiams, ar odontologijos klinikai, kuriai svarbu pasitikėjimas — tai buvo blogiau nei nieko. Balsas, kuris skamba svetimšališkai ir daro gramatines klaidas, nekuria pasitikėjimo. Jis aktyviai kenkia prekės ženklui.
Supratau, kad niekas šios problemos už mus neišspręs. Globalios AI kompanijos optimizuoja anglų, mandarinų ir ispanų kalboms — kalboms su šimtais milijonų kalbėtojų ir milžiniškomis komercinėmis rinkomis. Lietuvių kalba, su savo trimis milijonais kalbėtojų, niekada nebus prioritetas. Jei Lietuvos verslai nori turėti balso AI, kuris iš tiesų veikia, tai turi sukurti kažkas, kas supranta ir kalbą, ir technologiją.
Tuo „kažkuo" tapome mes.
Kas nutinka, kai globalus AI „prideda lietuvių kalbą"
Prieš pasakodamas, kaip išsprendėme problemą, parodysiu, kas nutinka, kai globali AI platforma tiesiog „prideda lietuvių kalbą" kaip vieną iš palaikomų kalbų. Tai realūs pavyzdžiai — tokios klaidos, kurias aptikome testavimo metu:
| Situacija | Globalus AI lietuviškai | AINORA lietuviškai |
|---|---|---|
| Pasisveikinimas su Jonu | „Sveiki, Jonas" (vardininkas — neteisingai) | „Sveiki, Jonai" (šauksmininkas — teisingai) |
| Pasisveikinimas su Giedriumi | „Sveiki, Giedrius" (vardininkas) | „Sveiki, Giedriau" (šauksmininkas — teisingai) |
| Vizito laiko patvirtinimas | „Jūsų vizitas yra penktadienį 14 valanda" (neteisingas linksnis) | „Jūsų vizitas penktadienį 14 valandą" (galininkas — teisingai) |
| Gydytojo paminėjimas | „Gydytoja Petrauskienė laukia jūs" (sulaužyta gramatika) | „Gydytoja Petrauskienė Jūsų laukia" (teisinga žodžių tvarka ir linksnis) |
| „Šiauliai" tarimas | „Šiau-li-ai" (angliškas akcentas) | „Šiau-liai" (teisingas lietuviškas kirtis) |
| Atsisveikinimas | „Ačiū ir viso gero, Jonas" (vėl neteisingas linksnis) | „Ačiū, Jonai! Viso gero" (teisingas šauksmininkas, natūrali frazė) |
| Praeito vizito aptarimas | „Jūsų paskutinis vizitas buvo sausio" (nebaigta) | „Jūsų paskutinis vizitas buvo sausio mėnesį" (pilna, natūrali frazė) |
Kiekviena iš šių klaidų yra pastebima gimtakalbiui lietuviui. Ir jos kaupiasi. Po dviejų ar trijų neteisingų linksnių iš eilės skambinantysis nustoja pasitikėti AI. Prašo sujungti su žmogumi. Visa sistemos esmė — efektyviai ir profesionaliai aptarnauti skambučius — sugriūva.
Kalbos „keistojo slėnio" efektas
Robotikoje yra fenomenas, vadinamas „keistuoju slėniu" (angl. uncanny valley) — robotas, kuris atrodo beveik kaip žmogus, bet ne visai, kelia daugiau nepatogumų nei akivaizdžiai mašiniškas robotas. Tas pats galioja ir kalbai. AI, kuris kalba lietuviškai beveik teisingai, bet ne visai, yra labiau erzinantis nei AI, kuris aiškiai kalba angliškai. Klientai gali toleruoti svetimą sistemą. Jie negali toleruoti sistemos, kuri apsimeta, kad kalba jų kalba, ir tai daro klaidingai.
Kaip kūrėme lietuviškai kalbantį AI
Tikrai lietuviškai kalbančio AI kūrimas nebuvo vienas proveržis. Tai buvo procesas — metodiškas, iteracinis ir dažnai varginantis. Štai kaip prie to priėjome:
Pradėjome nuo lingvistikos
Prieš rašydami nors vieną kodo eilutę, sudarėme kalbinį žemėlapį. Dirbome su lietuvių kalbos specialistais, dokumentuodami kiekvieną linksniuotės modelį, kiekvieną šauksmininko formą, kiekvieną tarimo taisyklę, kurios balso AI reikės verslo kontekste. Sudarėme lietuviškų vardų, pavardžių, vietovardžių, verslo terminų ir dažnų pokalbio frazių duomenų bazes — kiekvieną su visomis gramatinėmis formomis.
Sukūrėme specializuotus tarimo modelius
Standartiniai teksto-į-kalbą varikliai gamina lietuvių kalbą, kuri skamba mechaniškai. Mes tobulinome tarimo modelius specialiai lietuvių kalbos fonetikai — toniniams kirčiams, minkštiems ir kietiems priebalsiams, specifiniams ritmo ir intonacijos modeliams. Testavome su gimtakalbiais, kol rezultatas skambėjo kaip tikras žmogus, o ne kompiuteris, skaitantis žodyną.
Sukūrėme gramatiką suprantančią pokalbio logiką
Tai buvo sunkiausia dalis. Sukūrėme sistemas, kurios supranta gramatinį kontekstą — kreipiamasi? Naudok šauksmininką. Kalbama apie laiką? Naudok teisingą laiko linksnį. Patvirtinamas vardas? Naudok vardininką. Šis gramatinis supratimas veikia kiekviename AI sukurtame sakinyje, užtikrindamas teisingą linksnių naudojimą realaus laiko pokalbyje.
Sukūrėme lietuvių kalbos kokybės vertinimo sistemą
Kaip pamatuoti, ar AI gerai kalba lietuviškai? Standartinio etaloninio testo nėra. Sukūrėme savo vertinimo sistemą: šimtus testavimo scenarijų, apimančių pasisveikinimus, vizitų registraciją, vardų tvarkymą, laiko posakius ir kraštutinius atvejus. Kiekvienas sistemos pakeitimas praeina per šiuos testus. Jei viena šauksmininko forma sugenda — iš karto žinome.
Testavome su tikrais verslais ir tikrais skambintojais
Laboratorinis testavimas nuveda tik iki tam tikros ribos. Paleidome sistemą tikruose Lietuvos versluose ir klausėmės tikrų skambučių. Išgirdome kraštutinių atvejų, kurių niekada nebūtume numatę: sudurtinės pavardės, užsienietiški vardai, kuriems reikia lietuviškos linksniuotės, žemaitiški dialektai su kitokia intonacija, vyresnio amžiaus skambintojai, kalbantys formaliau. Kiekvienas kraštutinis atvejis tapo nauju testu mūsų vertinimo sistemoje.
Vardų problema — didžiausias mūsų iššūkis
Lietuviški vardai buvo mūsų didžiausias techninis iššūkis. Pagalvokite, ką AI turi padaryti, kai kažkas paskambina:
- Atpažinti skambintoją (pagal telefono numerį arba paklausus vardo)
- Nustatyti teisingą vardo šauksmininko formą
- Naudoti teisingą kilmininko formą aptariant įrašus („Jono vizitas", ne „Jonas vizitas")
- Teisingai tvarkyti pavardes skirtinguose kontekstuose
- Viską ištarti su teisingu kirčio modeliu
Kiekvienas žingsnis reikalauja skirtingų kalbinių žinių. O kraštutiniai atvejai yra begaliniai: „Tomas" šauksmininke — „Tomai"? O „Lukas" — „Lukai"? O „Dovydas" — „Dovydai"? Visi jie laikosi šiek tiek skirtingų modelių, nors atrodo panašiai.
Tada yra užsienietiški vardai, adaptuoti lietuvių kalboje: „Robertas" (šauksmininkas „Robertai"), „Edvardas" (šauksmininkas „Edvardai"), „Kristina" (šauksmininkas „Kristina"). O vardai iš visiškai kitų kultūrų — ką daryti, kai skambina „Ahmed" ar „Wei" į lietuvišką verslą? AI turi ir tokius atvejus elegantiškai suvaldyti, atpažindamas, kad ne visi vardai paklūsta lietuviškai linksniuotei.
Sukūrėme vardų apdorojimo sistemą, kuri tvarko tūkstančius lietuviškų vardų su teisingomis formomis, atpažįsta užsienietiškus vardus ir juos tinkamai apdoroja, bei grakščiai susitvarko su niekada nematytais vardais. Tai užtruko mėnesius. Tai buvo verta.
Ne tik vardai — visas pokalbis turi būti teisingas
Vardai buvo labiausiai matomas iššūkis, bet teisinga lietuvių kalba apima kur kas daugiau. Paimkime paprastą vizito patvirtinimą:
„Jūsų vizitas pas gydytoją Petrauskienę yra trečiadienį, vasario dvidešimt aštuntą dieną, keturiolika valandą trisdešimt minučių."
Tame viename sakinyje AI turi: naudoti galininką gydytojos pavardei po „pas" (Petrauskienę, ne Petrauskienė), naudoti galininką savaitės dienai (trečiadienį, ne trečiadienis), teisingai sulinksnuoti kelintinius skaitvardžius datai (dvidešimt aštuntą, ne dvidešimt aštuoni), ir naudoti galininką laikui (keturiolika valandą, ne keturiolika valanda). Keturi skirtingi linksnių sprendimai viename sakinyje, ir visi turi būti teisingi — kitaip viskas skamba klaidingai.
Rezultatai: globalus AI vs. AINORA
Po mėnesių kūrimo, testavimo ir iteracijų skirtumas tarp bendro lietuvių kalbos palaikymo ir to, ką sukūrėme, yra dramatiškas:
Bet skaičiai nepapasakoja visos istorijos. Tikras testas yra šis: kai lietuvis paskambina į verslą, naudojantį AINORA, jis iš karto nesupranta, kad kalba su AI. Ne todėl, kad bandome apgauti — AI prisistato kiekvieno skambučio pradžioje, kaip to reikalauja ES AI Aktas — o todėl, kad lietuvių kalba skamba natūraliai. Teisingi linksniai. Teisinga intonacija. Natūralios frazės. Tokia lietuvių kalba, kokios tikėtumėtės iš kompetentingos, profesionalios administratorės.
Tai standartas, kurį sau iškėlėme, ir tai, ką pateikiame.
Pasiklausykite patys
Mes tikime ne žodžiais, o demonstracijomis. Paskambinkite mūsų lietuviškai demo linijai +370 5 200 2553 ir pasikalbėkite lietuviškai. Pabandykite pavartoti savo vardą. Paklauskite apie vizito laikus. Patikrinkite gramatiką. Taip pat galite pabandyti anglišką demo liniją +1 (218) 636-0234 ir palyginti, arba apsilankykite mūsų demo puslapyje. Esame tikri, kad išgirsite skirtumą.
Kur esame dabar
Šiandien AINORA aptarnauja skambučius odontologijos klinikoms, viešbučiams, grožio salonams, veterinarijos klinikoms, autoservisams ir kitoms paslaugų įmonėms visoje Lietuvoje. Kiekvienas iš šių skambučių vyksta natūralia lietuvių kalba — su teisinga gramatika, tinkamu vardų tvarkymu ir profesionalia intonacija.
Bet mes nesustojame. Kalba yra gyvas dalykas, ir lietuvių kalba evoliucionuoja. Atsiranda naujų vardų, nauja verslo terminologija, regioniniai posakiai keičiasi. Mūsų vertinimo sistema pastebi regresijas, kalbininkai konsultantai peržiūri kraštutinius atvejus, ir sistema tobulėja su kiekvienu aptarnaujamu skambučiu.
Mes taip pat plečiame tai, ką mūsų lietuviškas AI gali padaryti. Be skambučių atsakymo ir vizitų registravimo, kuriame galimybes išeinančių skambučių automatizavimui, klientų atminčiai ir personalizavimui bei giliai CRM integracijai — visa tai natūralia lietuvių kalba.
Didesnis vaizdas yra toks: Lietuvos verslai neturėtų tenkintis AI, kuris skamba svetimšališkai arba daro gramatines klaidas. Trys milijonai žmonių kalba šia gražia, senovine kalba, ir jie nusipelno technologijos, kuri ją gerbia. Tai mes kuriame, ir tai tik pradžia.
Ką tai reiškia Lietuvos verslui
Jei dvejojote dėl balso AI savo Lietuvos verslui, nes išbandėte globalią platformą ir lietuvių kalba nebuvo pakankamai gera — suprantame. Mes patys jautėme tą patį nusivylimą. Būtent šis nusivylimas ir yra priežastis, kodėl AINORA egzistuoja.
Jūsų klientai skambina tikėdamiesi būti pasveikinti taisyklinga lietuvių kalba. Jūsų prekės ženklas priklauso nuo profesionalios komunikacijos. Negalite sau leisti AI, kuris vadina Jūsų klientą „Jonas", kai turėtų sakyti „Jonai", kuris neteisingai ištaria Jūsų miesto pavadinimą ar klumpa per linksnių kaitymus kaip pirmo kurso kalbų studentas. Perskaitykite, kaip veikia mūsų technologija, kad suprastumėte inžineriją, slypinčią už natūralaus lietuviško balso AI.
AINORA sukūrėme būtent tam, kad jums nereikėtų dėl to nerimauti. Lietuvių kalba tiesiog veikia — nes mes pasirūpinome, kad taip būtų.
Dažniausiai užduodami klausimai
Dažnai užduodami klausimai
AI yra treniruotas pirmiausia standartine lietuvių kalba, tačiau gerai susitvarko su regioninėmis variacijomis. Jis supranta skambintojus iš visų Lietuvos regionų, įskaitant tuos su žemaitišku ar aukštaitišku akcentu. Paties AI kalba naudoja standartinę lietuvių kalbą, kuri yra suprantama universaliai. Jei skambintojas naudoja stipriai tarmiškus žodžius, AI gali paprašyti patikslinti — lygiai kaip tai darytų žmogus administratorius iš kito regiono.
Mėnesius susikaupusio darbo, neskaičiuojant nuolatinio tobulinimo. Pradinis kalbinis žemėlapis užtruko kelias savaites. Tarimo modelių kūrimas ir tobulinimas — ilgiau. Gramatiką suprantanti pokalbio logika buvo laiko imliausias komponentas. Mes ir toliau tobulėjame su kiekviena realaus naudojimo savaite.
Taip. Mūsų sistema apdoroja tūkstančius lietuviškų vardų ir pavardžių su teisingomis šauksmininko ir kitų linksnių formomis. Retesniems ar naujiems vardams turime kalbinių taisyklių variklį, kuris pritaiko teisingą linksniuotės modelį pagal vardo galūnę. Retais atvejais, kai vardas yra visiškai naujas, sistema grakščiai susitvarko, o ne spėja klaidingai. Mūsų vardų duomenų bazė nuolat atnaujinama.
Taip. AINORA palaiko dvikalbį veikimą. Jei skambintojas pradeda angliškai, AI atsako angliškai. Jei pokalbio metu persijungia į lietuvių kalbą, AI seka paskui. Tai ypač naudinga verslams, aptarnaujantiems ir lietuvius, ir tarptautinius klientus — viešbučiams, medicinos turizmo klinikoms ir tarptautinėms paslaugų įmonėms.
Vertimo įrankiai konvertuoja tekstą tarp kalbų, bet netvarko realaus laiko kalbinių pokalbių, kontekstinės gramatikos ar natūralaus tarimo. AINORA yra pokalbio AI sistema — ji supranta kalbamą lietuvių kalbą, išlaiko kontekstą viso pokalbio metu, pritaiko teisingą gramatiką realiu laiku ir kalba natūraliu lietuvišku tarimu. Tai yra fundamentaliai skirtingos galimybės.
Justas Butkus
AInora steigėjas ir vadovas
Kuriu AI skaitmeninius administratorius, kurie pakeičia registratūros darbuotojus paslaugų verslams visoje Europoje. Anksčiau kūriau balso AI sistemas odontologijos klinikoms, viešbučiams ir restoranams.
justasbutkus.comPasiruošę išbandyti AI savo verslui?
Išgirskite, kaip AInora skamba tvarkydama tikrą verslo skambutį. Išbandykite balso demo arba užsirezervuokite konsultaciją.
Susiję straipsniai
AI balso agentas Lietuvoje: pilnas 2026 vadovas
Viskas apie AI balso agentus Lietuvos rinkoje — galimybės, tiekėjai ir realūs naudojimo atvejai.
Kas yra AI balso agentas? Pilnas vadovas
Išsamus paaiškinimas, kas yra AI balso agentai, kaip jie veikia ir kodėl tai svarbu verslui.
Top AI balso agentai Lietuvoje 2026
Geriausių AI balso agentų sprendimų Lietuvoje palyginimas.
Skambučių automatizavimas su AI: pilnas vadovas
Kaip automatizuoti telefono skambučius su AI — nuo įeinančių skambučių iki išeinančių kampanijų.