AI žodynasbalso AIterminijaverslo AI

AI terminų žodynas: 30+ balso AI ir verslo automatizavimo sąvokų

JB
Justas Butkus
··12 min skaitymo

Kas yra šis puslapis?

AI terminija gali atrodyti sudėtinga, kai renkate technologiją savo verslui. Šis žodynas paaiškina 30+ terminų paprastais žodžiais, su realiomis iliustracijomis, kaip kiekviena sąvoka taikoma balso AI, klientų aptarnavimo automatizavimui ir verslo procesams. Išsisaugokite šį puslapį ir grįžkite, kai sutiksite nepažįstamą terminą.

Nesvarbu, ar tyrinėjate AI balso agentus, vertinate skaitmeninį administratorių savo verslui, ar tiesiog bandote suprasti, ką jums sako technologijų pardavėjai — šis žodynas padės. Kiekvienas terminas apima glaustą apibrėžimą ir, kur aktualu, nuorodas į gilesnę medžiagą.

A-D

AI agentas (DI agentas)

AI agentas — tai programinė įranga, kuri gali suvokti savo aplinką, priimti sprendimus ir savarankiškai atlikti veiksmus tikslui pasiekti. Skirtingai nuo paprastų pokalbių robotų, kurie seka iš anksto nustatytus scenarijus, AI agentas mąsto apie kontekstą, naudoja įrankius (pavyzdžiui, kalendoriaus peržiūrą ar duomenų bazės užklausą) ir pritaiko savo veiksmų planą realiu laiku. Versle AI agentai atlieka tokias užduotis kaip telefono skambučių priėmimas, vizitų planavimas ar klientų užklausų tvarkymas be žmogaus įsikišimo.

AI balso agentas

AI balso agentas — tai AI agentas, kuris bendrauja šnekamąja kalba per telefono skambučius arba balso sąsajas. Jis sujungia kalbos atpažinimą, natūralios kalbos supratimą ir teksto pavertimą kalba, kad galėtų vesti pokalbius realiu laiku. Šiuolaikiniai AI balso agentai gali atlikti sudėtingas užduotis: registruoti vizitus, atsakyti į daugiadalius klausimus ir perduoti skambučius žmonėms, kai reikia. Jie skiriasi nuo senų IVR sistemų tuo, kad supranta laisvą kalbą — skambinančiajam nereikia spaudinėti mygtukų. Taip pat žiūrėkite: AI balso agentas vs. AI balso asistentas.

Automatinis kalbos atpažinimas (ASR)

Automatinis kalbos atpažinimas (angl. Automatic Speech Recognition) — tai technologija, kuri paverčia ištartus žodžius tekstu. Tai pirmas žingsnis bet kurioje balso AI grandinėje: skambinantysis kalba, ASR perrašo žodžius, o AI apdoroja gautą tekstą. Šiuolaikinės ASR sistemos gerai tvarkosi su akcentais, foniniu triukšmu ir keliomis kalbomis. Plačiau apie visą balso AI procesą skaitykite mūsų 3 žingsnių balso AI paaiškinime.

BDAR (Bendrasis duomenų apsaugos reglamentas)

BDAR (angl. GDPR) — tai Europos Sąjungos reglamentas, reglamentuojantis, kaip organizacijos renka, saugo ir apdoroja asmens duomenis. Bet kuri AI sistema, tvarkanti klientų informaciją Europoje, privalo atitikti BDAR reikalavimus. Tai reiškia skaidrią duomenų naudojimo politiką, klientų teisę prašyti duomenų ištrynimo, saugų skambučių įrašų ir transkripcijų saugojimą bei aiškius sutikimo mechanizmus. Renkantis AI tiekėją, BDAR atitiktis turėtų būti privalomas reikalavimas.

Daugiažingsnis pokalbis

Daugiažingsnis pokalbis — tai dialogas, apimantis kelis klausimų-atsakymų pasikeitimus tarp skambinančiojo ir AI. Vietoj to, kad atsakytų į vieną klausimą ir baigtų, AI išlaiko kontekstą per visą pokalbį: atsimena, kas buvo pasakyta anksčiau, grįžta prie ankstesnių temų ir papildo jau nustatytą informaciją. „Norėčiau užsiregistruoti penktadienį" ... „Iš tikrųjų, geriau šeštadienį" ... „Ir ar galite pridėti dar vieną žmogų?" — natūralus šio srauto valdymas reikalauja daugiažingsnio pokalbio galimybės.

Skaitmeninis administratorius

Skaitmeninis administratorius — tai AI sistema, kuri atlieka kasdienes administracines užduotis, kurias paprastai vykdo registratūros darbuotojas: atsiliepia į telefono skambučius, planuoja vizitus, atsako į dažnus klausimus ir nukreipia sudėtingas užklausas tinkamam žmogui. Jis sujungia balso AI, kalendoriaus integraciją ir verslo specifines žinias, kad veiktų savarankiškai. Skaitmeniniai administratoriai yra žingsnis toliau nei paprasti balso agentai, nes jie valdo visą darbo procesą, ne tik pokalbius.

E-I

E-E-A-T (Google)

E-E-A-T reiškia patirtį (Experience), ekspertizę (Expertise), autoritetingumą (Authoritativeness) ir patikimumą (Trustworthiness). Tai sistema, kurią Google naudoja turinio kokybei vertinti paieškos reitinguose. Verslams, diegiantiems AI, E-E-A-T svarbi, nes jūsų svetainės turinys, tinklaraščio įrašai ir dokumentacija signalizuoja, ar esate patikimas šaltinis. AI sugeneruotas turinys, kuriam trūksta tikros ekspertizės ar realios patirties, bus blogai vertinamas paieškoje.

Haliucinacija (AI)

AI haliucinacija įvyksta, kai sistema generuoja užtikrintai skambančią informaciją, kuri yra faktiškai neteisinga arba visiškai išgalvota. Pavyzdžiui, AI balso agentas gali paminėti paslaugą, kurios jūsų verslas nesiūlo, arba nurodyti neegzistuojančią kainą. Haliucinacijos yra žinomas didelių kalbos modelių apribojimas. Gerai sukurtos AI sistemos mažina haliucinacijas apribodamos modelį patikrinta žinių baze ir naudodamos tokias technikas kaip RAG (žr. toliau), kad atsakymai būtų pagrįsti faktiniais duomenimis.

Interaktyvus balso atsakiklis (IVR)

IVR (angl. Interactive Voice Response) — tai tradicinė telefono meniu sistema: „Spauskite 1 dėl pardavimų, spauskite 2 dėl pagalbos." IVR sistemos nukreipia skambinančiuosius per fiksuotus sprendimų medžius naudojant mygtukus arba paprastas balso komandas. Nors IVR tarnavo verslui dešimtmečius, jis yra nelankstus, erzinantis ir nepajėgus tvarkyti niuansuotų užklausų. AI balso agentai keičia IVR, nes jie supranta laisvą kalbą ir išsprendžia užklausas viename pokalbyje, o ne per mygtukų meniu grandinę.

Ketinimų atpažinimas

Ketinimų atpažinimas — tai AI gebėjimas nustatyti, ką skambinantysis nori pasiekti. Kai kažkas sako „Norėčiau perkelti vizitą į kitą antradienį," AI turi identifikuoti ketinimą (perkelti), išgauti reikiamas detales (kitas antradienis) ir nukreipti užklausą į teisingą veiksmą. Stiprus ketinimų atpažinimas skiria naudingą AI nuo erzinančio. Jis glaudžiai bendradarbiauja su natūralios kalbos apdorojimu, kad suprastų ne tik žodžius, bet ir tikslą.

K-N

Klientų atmintis

Klientų atmintis — tai AI sistemos gebėjimas prisiminti informaciją iš ankstesnių sąveikų su tuo pačiu klientu. Skirtingai nuo tradicinių telefoninių sistemų, kurios kiekvieną skambutį traktuoja kaip naują, AI su klientų atmintimi gali pasakyti: „Sveiki sugrįžusi, ponia Jonaite. Praėjusį kartą domėjotės mūsų premium paketu. Ar norėtumėte tęsti tą pokalbį?" Tai sukuria personalizuotą patirtį, kuri stiprina lojalumą. Plačiau apie tai — kaip AI prisimena klientus.

Klientų ryšių valdymo sistema (CRM)

CRM (angl. Customer Relationship Management) sistema saugo ir organizuoja klientų duomenis: kontaktinę informaciją, sąveikų istoriją, pirkimų įrašus ir pastabas. Kai CRM integruojamas su AI, jis tampa gyvuoju konteksto šaltiniu. AI balso agentas, prijungtas prie jūsų CRM, gali pasveikinti grįžtantį klientą vardu, nurodyti jo paskutinį vizitą ir personalizuoti pokalbį. Mūsų CRM ir AI asistento integracijos vadovas detaliai aprašo populiariausias konfigūracijas.

Didelis kalbos modelis (LLM)

Didelis kalbos modelis (angl. Large Language Model) — tai AI variklis, kuriuo remiasi šiuolaikinės pokalbių sistemos. LLM, tokie kaip GPT-4, Claude ir Gemini, yra apmokyti iš milžiniškų tekstinių duomenų kiekių suprasti ir generuoti žmogišką kalbą. Jie veikia nuo pokalbių robotų iki balso agentų ir turinio generavimo įrankių. Balso AI srityje LLM yra „smegenys", kurios apdoroja perrašytą kalbą, samprotauja apie tinkamą atsakymą ir sugeneruoja atsakymo tekstą, prieš jį paverčiant atgal į kalbą.

Natūralios kalbos apdorojimas (NLP)

Natūralios kalbos apdorojimas (angl. Natural Language Processing) — tai plati AI sritis, skirta padėti kompiuteriams suprasti, interpretuoti ir generuoti žmogaus kalbą. NLP apima daug užduočių: ketinimų atpažinimą, nuotaikos analizę, esybių išgavimą (vardų, datų ir skaičių identifikavimą kalboje) ir kalbos generavimą. Balso AI srityje NLP yra sluoksnis tarp kalbos transkripcijos ir prasmingo veiksmo — tai leidžia AI suprasti, kad „gal galėtumėt man laiko duot ketvirtadienį po pietų" reiškia, jog klientas nori vizito ketvirtadienio popietę.

Nuosavybės valdymo sistema (PMS)

PMS (angl. Property Management System) — tai pagrindinė programinė įranga, kurią viešbučiai ir apgyvendinimo verslai naudoja rezervacijoms, kambarių inventoriui, svečių profiliams, atsiskaitymams ir ūkio tarnybai valdyti. Populiarios PMS platformos: Opera, Mews, Cloudbeds ir Little Hotelier. Kai AI balso agentas integruojamas su PMS, jis gali tikrinti prieinamumą realiu laiku, kurti rezervacijas ir pasiekti svečių istoriją skambučio metu. PMS integracija leidžia AI viešbučio recepcijai savarankiškai tvarkyti visą rezervacijos procesą.

O-R

Daugiakanalis aptarnavimas (Omnichannel)

Daugiakanalis aptarnavimas (angl. Omnichannel) — tai vieninga klientų aptarnavimo strategija per visus komunikacijos kanalus: telefoną, el. paštą, pokalbių langą, SMS, socialinius tinklus ir gyvai. Omnichannel aplinkoje klientas, pradėjęs pokalbį per pokalbių langą ir paskui paskambinęs telefonu, neturi kartoti savo informacijos. AI sistemos su daugiakanale galimybe išlaiko kontekstą per visus kanalus, sukurdamos sklandžią patirtį, nepriklausomai nuo to, kaip klientas kreipiasi.

Pokalbių robotas (Chatbot)

Pokalbių robotas — tai programinė įranga, kuri veda tekstinius pokalbius, dažniausiai svetainėse, žinučių programėlėse ar socialiniuose tinkluose. Pokalbių robotai gali būti nuo paprastų taisyklėmis paremtų sistemų iki AI valdomų asistentų, kurie supranta kontekstą ir generuoja dinaminius atsakymus. Tačiau pokalbių robotai negali tvarkyti telefono skambučių ar balso sąveikų. Verslams, gaunantiems daug skambučių, svarbu suprasti skirtumus tarp pokalbių robotų ir AI balso asistentų.

Paieška papildyta generacija (RAG)

RAG (angl. Retrieval-Augmented Generation) — tai technika, kuri pagerina AI tikslumą sujungdama kalbos modelį su paieškos sistema. Užuot pasikliavus vien tuo, kuo LLM buvo apmokytas, RAG realiu laiku suranda atitinkamus dokumentus ar duomenis iš jūsų verslo žinių bazės, o tada naudoja tą informaciją atsakymui generuoti. Tai drastiškai sumažina haliucinacijas, nes AI grindžia savo atsakymus patikrintais, aktualiais duomenimis. Pavyzdžiui, kai skambinantysis klausia apie atšaukimo politiką, RAG užtikrina, kad AI cituoja jūsų tikrąją politiką, o ne improvizuoja.

Realaus laiko API

Realaus laiko API (angl. Real-time API) — tai programavimo sąsaja, kuri apdoroja duomenis su minimaliu vėlinimu, leidžiančiu momentinę sąveiką. Balso AI srityje realaus laiko API (pavyzdžiui, OpenAI Realtime API) leidžia kalbą transliuoti tiesiai į AI modelį, o atsakymus — atgal, pašalinant paketinio apdorojimo vėlinimus. Būtent tai daro šiuolaikinius balso AI pokalbius natūralius — atsakymo laikas pakankamai greitas, kad skambinantysis jaustų, jog AI kalba realiu laiku.

S-T

SIP protokolas

SIP (angl. Session Initiation Protocol) — tai standartinis protokolas, naudojamas balso skambučiams internetu (VoIP) inicijuoti, palaikyti ir nutraukti. Kai AI balso agentas atsiliepia į telefono skambutį, SIP tvarko ryšį tarp telefono tinklo ir AI sistemos. SIP magistralė (trunk) leidžia verslams prijungti AI prie esamų telefono numerių ir PBX sistemų nekeičiant infrastruktūros.

Skambučio peradresavimas (Transfer)

Skambučio peradresavimas — tai procesas, kai AI perduoda aktyvų telefono skambutį žmogui-darbuotojui. Geros AI sistemos atlieka „šiltą perdavimą" — perduoda pokalbio santrauką, kad žmogus nereikėtų skambinančiojo prašyti kartoti viską iš naujo. Peradresavimo galimybė yra būtina, nes joks AI negali suvaldyti kiekvienos situacijos. Geriausi AI balso agentai atpažįsta, kada užklausa viršija jų galimybes, ir sklandžiai nukreipia skambutį su pilnu kontekstu tinkamam komandos nariui.

Kalba į tekstą (STT)

Kalba į tekstą (angl. Speech-to-Text, taip pat vadinama ASR) — tai procesas, kurio metu ištartas garsas paverčiamas rašytiniu tekstu. STT yra bet kurios balso AI sistemos įvesties sluoksnis. Skambinantysis kalba, STT perrašo žodžius, ir AI apdoroja tekstą. STT tikslumas priklauso nuo kalbos, akcento ir garso kokybės. Verslams, dirbantiems daugiakalbėje aplinkoje, STT, kuris tiksliai atpažįsta tokias kalbas kaip lietuvių, yra esminis.

Tekstas į kalbą (TTS)

Tekstas į kalbą (angl. Text-to-Speech) — tai technologija, kuri paverčia rašytinį tekstą ištartu garsu. TTS yra balso AI sistemos išvesties sluoksnis: AI sugeneruoja tekstinį atsakymą, o TTS paverčia jį natūraliai skambančia kalba. Šiuolaikinės TTS sistemos kuria balsus, kurie beveik neatskiriami nuo žmogaus kalbos, su tinkama intonacija, tempu ir net emociniu atspalviu. TTS kokybė tiesiogiai veikia, kaip skambinantieji suvokia AI. Norėdami suprasti skirtumą, perskaitykite ar AI tikrai gali kalbėti kaip žmogus.

V-Ž

Užklausa (Prompt)

Užklausa (angl. Prompt) — tai instrukcija ar kontekstas, pateikiamas AI modeliui, kad nukreiptų jo elgesį. Balso AI srityje sisteminė užklausa apibrėžia AI asmenybę, žinių ribas, taisykles (ką gali ir ko negali sakyti) bei darbo procesus. Gerai sukurta užklausa yra tai, kas leidžia AI balso agentui skambėti taip, lyg jis priklauso būtent jūsų verslui, o ne generiškai. Užklausų inžinerija (Prompt engineering) — tai iteracinis šių instrukcijų tobulinimo procesas.

Vėlinimas (Latency)

Vėlinimas — tai laiko tarpas nuo tada, kai skambinantysis baigia sakinį, iki tada, kai AI pradeda atsakyti. Balso AI srityje mažas vėlinimas yra kritiškai svarbus natūraliam pokalbiui. Jei AI trunka ilgiau nei 500-800 milisekundžių atsakyti, pokalbis jaučiasi nenatūraliai, ir skambinantieji gali pradėti kartoti arba padėti ragelį. Vėlinimas priklauso nuo visos grandinės: kalbos atpažinimo greičio, LLM apdorojimo laiko ir teksto pavertimo kalba spartos. Geriausios sistemos pasiekia mažiau nei 500ms nuo pradžios iki galo. Plačiau — mūsų techninis balso AI paaiškinimas.

Balso AI (Voice AI)

Balso AI — tai bendras terminas dirbtinio intelekto sistemoms, kurios sąveikauja šnekamąja kalba. Jis apima visą technologijų grandinę: kalbos atpažinimą (ASR/STT), natūralios kalbos supratimą (NLP), atsakymų generavimą (LLM) ir kalbos sintezę (TTS). Balso AI valdo programas nuo išmaniųjų garsiakalbių iki telefonu grįsto klientų aptarnavimo. Verslo kontekste Balso AI paprastai reiškia sistemas, kurios tvarko telefono skambučius ir balso sąveikas įmonės vardu. Apsilankykite mūsų paslaugų puslapyje ir sužinokite, kaip balso AI taikomas realiems verslo scenarijams.

Balso valdiklis (Voice Widget)

Balso valdiklis — tai įterpiama sąsaja, leidžianti svetainės lankytojams bendrauti su AI balso agentu tiesiogiai iš tinklalapio. Vietoj to, kad AI siūlytumėte tik per telefono skambučius, balso valdiklis prideda mikrofono mygtuką jūsų svetainėje, kur lankytojai gali užduoti klausimus balsu ir gauti ištartus atsakymus. Tai sujungia tekstinį pokalbių langą su telefonu grįstu balso AI. Sužinokite daugiau apie tai, kaip veikia mūsų technologija telefone ir internete.

Webhook (tinklo kabliukas)

Webhook — tai automatinė žinutė, siunčiama iš vienos sistemos į kitą, kai įvyksta konkretus įvykis. Balso AI srityje webhook naudojami veiksmams po skambučių: santraukos siuntimui el. paštu verslo savininkui, CRM įrašo sukūrimui, vizitų kalendoriaus atnaujinimui arba komandos nario informavimui apie skubią užklausą. Webhook yra jungiamasis audinys, sujungiantis AI balso agentą su kitais jūsų verslo įrankiais, leidžiantis visapusę automatizaciją, o ne tik pokalbių tvarkymą.

Žetonas (Token)

AI srityje žetonas (angl. Token) — tai bazinis teksto vienetas, kurį apdoroja kalbos modeliai. Žetonas gali būti žodis, žodžio dalis arba skyrybos ženklas. Pavyzdžiui, žodis „supratimas" gali būti padalintas į du žetonus: „suprat" ir „imas". Žetonai svarbūs dėl dviejų priežasčių: jie nulemia, kiek konteksto AI gali apdoroti viename pokalbyje (vadinamas „konteksto langas"), ir jie yra AI naudojimo matavimo ir apmokestinimo vienetas. Sudėtingesni pokalbiai reikalauja daugiau žetonų.

Žinių bazė

Žinių bazė — tai struktūrizuota informacijos kolekcija, iš kurios AI sistema semiasi atsakydama į klausimus. Verslo AI atveju tai paprastai apima siūlomas paslaugas, kainas, darbo valandas, vietos informaciją, politikas (atšaukimo, grąžinimo ir kt.) ir atsakymus į dažniausiai užduodamus klausimus. Žinių bazės kokybė tiesiogiai lemia AI atsakymų kokybę. Gerai prižiūrima žinių bazė yra skirtumas tarp AI, kuris skamba kompetentingai, ir AI, kuris skamba generiškai.

Kaip naudoti šį žodyną

Tai gyvas dokumentas. AI technologijai tobulėjant, pridėsime naujų terminų ir atnaujinsime esamus apibrėžimus. Jei sutiksite terminą pokalbiuose su AI tiekėjais, kurio čia nematote, susisiekite su mumis — ir mes jį pridėsime.

Dažnai užduodami klausimai

Pokalbių robotas bendrauja tekstu svetainėse ar žinučių programėlėse. AI balso agentas bendrauja šnekamąja kalba per telefono skambučius. Nors abu naudoja AI supratimui ir atsakymams, balso agentams reikia papildomų technologijų sluoksnių: kalbos atpažinimo (garsas į tekstą) ir teksto pavertimo kalba (atsakymo pavertimas garsu). Balso agentai tvarko telefono kanalą, kurio pokalbių robotai nepasiekia.

Ne. Jums nereikia suprasti techninių detalių, kad gautumėte naudos iš AI. Tačiau bazinių žinių turėjimas padeda užduoti geresnius klausimus vertinant tiekėjus, suprasti, už ką mokate, ir priimti labiau informuotus sprendimus. Tai panašu kaip su automobilio mechanika: jums nereikia būti inžinieriumi, bet žinoti, kas yra pavarų dėžė, padeda bendrauti su meistru.

RAG reiškia „paieška papildyta generacija“ (Retrieval-Augmented Generation). Tai technika, kai AI ieško konkrečių jūsų verslo duomenų prieš generuodamas atsakymą, užuot pasikliavęs vien savo apmokymu. Tai svarbu, nes drastiškai sumažina haliucinacijas (neteisingą informaciją) ir užtikrina, kad AI pateikia atsakymus pagal jūsų tikrąsias paslaugas, kainas ir politikas, o ne kuria dalykus.

Vėlinimas matuojamas milisekundėmis nuo tada, kai skambinantysis baigia kalbėti, iki tada, kai AI pradeda atsakyti. Mažiau nei 500 milisekundžių jaučiasi natūraliai ir pokalbiškai. Tarp 500-800ms yra priimtina, bet pastebima. Daugiau nei 1 sekundė sukuria nepatogias pauzes, kurios blogina skambinančiojo patirtį. Geriausios balso AI sistemos nuosekliai pasiekia mažiau nei 500ms vėlinimą.

Šios trys technologijos sudaro bet kurio balso AI skambučio pagrindą. STT (kalba į tekstą) paverčia skambinančiojo ištartus žodžius tekstu. LLM (didelis kalbos modelis) apdoroja tą tekstą, supranta ketinimą ir sugeneruoja tekstinį atsakymą. TTS (tekstas į kalbą) paverčia atsakymo tekstą natūraliai skambančia kalba. Šis trijų žingsnių procesas vyksta realiu laiku, paprastai per mažiau nei 500 milisekundžių.

JB
Justas Butkus

AInora steigėjas ir vadovas

Kuriu AI skaitmeninius administratorius, kurie pakeičia registratūros darbuotojus paslaugų verslams visoje Europoje. Anksčiau kūriau balso AI sistemas odontologijos klinikoms, viešbučiams ir restoranams.

Visi straipsniai

Pasiruošę išbandyti AI savo verslui?

Išgirskite, kaip AInora skamba tvarkydama tikrą verslo skambutį. Išbandykite balso demo arba užsirezervuokite konsultaciją.