DI terminų žodynas: 30+ balso DI ir verslo automatizavimo sąvokų
Kas yra šis puslapis?
DI terminija gali atrodyti sudėtinga, kai renkate technologiją savo verslui. Šis žodynas paaiškina 30+ terminų paprastais žodžiais, su realiomis iliustracijomis, kaip kiekviena sąvoka taikoma balso DI, klientų aptarnavimo automatizavimui ir verslo procesams. Išsisaugokite šį puslapį ir grįžkite, kai sutiksite nepažįstamą terminą.
Nesvarbu, ar tyrinėjate DI balso agentus, vertinate skaitmeninį administratorių savo verslui, ar tiesiog bandote suprasti, ką jums sako technologijų pardavėjai - šis žodynas padės. Kiekvienas terminas apima glaustą apibrėžimą ir, kur aktualu, nuorodas į gilesnę medžiagą.
A-D
DI agentas (DI agentas)
DI agentas - tai programinė įranga, kuri gali suvokti savo aplinką, priimti sprendimus ir savarankiškai atlikti veiksmus tikslui pasiekti. Skirtingai nuo paprastų pokalbių robotų, kurie seka iš anksto nustatytus scenarijus, DI agentas mąsto apie kontekstą, naudoja įrankius (pavyzdžiui, kalendoriaus peržiūrą ar duomenų bazės užklausą) ir pritaiko savo veiksmų planą realiu laiku. Versle DI agentai atlieka tokias užduotis kaip telefono skambučių priėmimas, vizitų planavimas ar klientų užklausų tvarkymas be žmogaus įsikišimo.
DI balso agentas
DI balso agentas - tai DI agentas, kuris bendrauja šnekamąja kalba per telefono skambučius arba balso sąsajas. Jis sujungia kalbos atpažinimą, natūralios kalbos supratimą ir teksto pavertimą kalba, kad galėtų vesti pokalbius realiu laiku. Šiuolaikiniai DI balso agentai gali atlikti sudėtingas užduotis: registruoti vizitus, atsakyti į daugiadalius klausimus ir perduoti skambučius žmonėms, kai reikia. Jie skiriasi nuo senų IVR sistemų tuo, kad supranta laisvą kalbą - skambinančiajam nereikia spaudinėti mygtukų. Taip pat žiūrėkite: DI balso agentas vs. DI balso asistentas.
Automatinis kalbos atpažinimas (ASR)
Automatinis kalbos atpažinimas (angl. Automatic Speech Recognition) - tai technologija, kuri paverčia ištartus žodžius tekstu. Tai pirmas žingsnis bet kurioje balso DI grandinėje: skambinantysis kalba, ASR perrašo žodžius, o DI apdoroja gautą tekstą. Šiuolaikinės ASR sistemos gerai tvarkosi su akcentais, foniniu triukšmu ir keliomis kalbomis. Plačiau apie visą balso DI procesą skaitykite mūsų 3 žingsnių balso DI paaiškinime.
BDAR (Bendrasis duomenų apsaugos reglamentas)
BDAR (angl. GDPR) - tai Europos Sąjungos reglamentas, reglamentuojantis, kaip organizacijos renka, saugo ir apdoroja asmens duomenis. Bet kuri DI sistema, tvarkanti klientų informaciją Europoje, privalo atitikti BDAR reikalavimus. Tai reiškia skaidrią duomenų naudojimo politiką, klientų teisę prašyti duomenų ištrynimo, saugų skambučių įrašų ir transkripcijų saugojimą bei aiškius sutikimo mechanizmus. Renkantis DI tiekėją, BDAR atitiktis turėtų būti privalomas reikalavimas.
Daugiažingsnis pokalbis
Daugiažingsnis pokalbis - tai dialogas, apimantis kelis klausimų-atsakymų pasikeitimus tarp skambinančiojo ir DI. Vietoj to, kad atsakytų į vieną klausimą ir baigtų, DI išlaiko kontekstą per visą pokalbį: atsimena, kas buvo pasakyta anksčiau, grįžta prie ankstesnių temų ir papildo jau nustatytą informaciją. „Norėčiau užsiregistruoti penktadienį" ... „Iš tikrųjų, geriau šeštadienį" ... „Ir ar galite pridėti dar vieną žmogų?" - natūralus šio srauto valdymas reikalauja daugiažingsnio pokalbio galimybės.
Skaitmeninis administratorius
Skaitmeninis administratorius - tai DI sistema, kuri atlieka kasdienes administracines užduotis, kurias paprastai vykdo registratūros darbuotojas: atsiliepia į telefono skambučius, planuoja vizitus, atsako į dažnus klausimus ir nukreipia sudėtingas užklausas tinkamam žmogui. Jis sujungia balso DI, kalendoriaus integraciją ir verslo specifines žinias, kad veiktų savarankiškai. Skaitmeniniai administratoriai yra žingsnis toliau nei paprasti balso agentai, nes jie valdo visą darbo procesą, ne tik pokalbius.
E-I
E-E-A-T (Google)
E-E-A-T reiškia patirtį (Experience), ekspertizę (Expertise), autoritetingumą (Authoritativeness) ir patikimumą (Trustworthiness). Tai sistema, kurią Google naudoja turinio kokybei vertinti paieškos reitinguose. Verslams, diegiantiems DI, E-E-A-T svarbi, nes jūsų svetainės turinys, tinklaraščio įrašai ir dokumentacija signalizuoja, ar esate patikimas šaltinis. DI sugeneruotas turinys, kuriam trūksta tikros ekspertizės ar realios patirties, bus blogai vertinamas paieškoje.
Haliucinacija (DI)
DI haliucinacija įvyksta, kai sistema generuoja užtikrintai skambančią informaciją, kuri yra faktiškai neteisinga arba visiškai išgalvota. Pavyzdžiui, DI balso agentas gali paminėti paslaugą, kurios jūsų verslas nesiūlo, arba nurodyti neegzistuojančią kainą. Haliucinacijos yra žinomas didelių kalbos modelių apribojimas. Gerai sukurtos DI sistemos mažina haliucinacijas apribodamos modelį patikrinta žinių baze ir naudodamos tokias technikas kaip RAG (žr. toliau), kad atsakymai būtų pagrįsti faktiniais duomenimis.
Interaktyvus balso atsakiklis (IVR)
IVR (angl. Interactive Voice Response) - tai tradicinė telefono meniu sistema: „Spauskite 1 dėl pardavimų, spauskite 2 dėl pagalbos." IVR sistemos nukreipia skambinančiuosius per fiksuotus sprendimų medžius naudojant mygtukus arba paprastas balso komandas. Nors IVR tarnavo verslui dešimtmečius, jis yra nelankstus, erzinantis ir nepajėgus tvarkyti niuansuotų užklausų. DI balso agentai keičia IVR, nes jie supranta laisvą kalbą ir išsprendžia užklausas viename pokalbyje, o ne per mygtukų meniu grandinę.
Ketinimų atpažinimas
Ketinimų atpažinimas - tai DI gebėjimas nustatyti, ką skambinantysis nori pasiekti. Kai kažkas sako „Norėčiau perkelti vizitą į kitą antradienį," DI turi identifikuoti ketinimą (perkelti), išgauti reikiamas detales (kitas antradienis) ir nukreipti užklausą į teisingą veiksmą. Stiprus ketinimų atpažinimas skiria naudingą DI nuo erzinančio. Jis glaudžiai bendradarbiauja su natūralios kalbos apdorojimu, kad suprastų ne tik žodžius, bet ir tikslą.
K-N
Klientų atmintis
Klientų atmintis - tai DI sistemos gebėjimas prisiminti informaciją iš ankstesnių sąveikų su tuo pačiu klientu. Skirtingai nuo tradicinių telefoninių sistemų, kurios kiekvieną skambutį traktuoja kaip naują, DI su klientų atmintimi gali pasakyti: „Sveiki sugrįžusi, ponia Jonaite. Praėjusį kartą domėjotės mūsų premium paketu. Ar norėtumėte tęsti tą pokalbį?" Tai sukuria personalizuotą patirtį, kuri stiprina lojalumą. Plačiau apie tai - kaip DI prisimena klientus.
Klientų ryšių valdymo sistema (CRM)
CRM (angl. Customer Relationship Management) sistema saugo ir organizuoja klientų duomenis: kontaktinę informaciją, sąveikų istoriją, pirkimų įrašus ir pastabas. Kai CRM integruojamas su DI, jis tampa gyvuoju konteksto šaltiniu. DI balso agentas, prijungtas prie jūsų CRM, gali pasveikinti grįžtantį klientą vardu, nurodyti jo paskutinį vizitą ir personalizuoti pokalbį. Mūsų CRM ir DI asistento integracijos vadovas detaliai aprašo populiariausias konfigūracijas.
Didelis kalbos modelis (LLM)
Didelis kalbos modelis (angl. Large Language Model) - tai DI variklis, kuriuo remiasi šiuolaikinės pokalbių sistemos. LLM, tokie kaip GPT-4, Claude ir Gemini, yra apmokyti iš milžiniškų tekstinių duomenų kiekių suprasti ir generuoti žmogišką kalbą. Jie veikia nuo pokalbių robotų iki balso agentų ir turinio generavimo įrankių. Balso DI srityje LLM yra „smegenys", kurios apdoroja perrašytą kalbą, samprotauja apie tinkamą atsakymą ir sugeneruoja atsakymo tekstą, prieš jį paverčiant atgal į kalbą.
Natūralios kalbos apdorojimas (NLP)
Natūralios kalbos apdorojimas (angl. Natural Language Processing) - tai plati DI sritis, skirta padėti kompiuteriams suprasti, interpretuoti ir generuoti žmogaus kalbą. NLP apima daug užduočių: ketinimų atpažinimą, nuotaikos analizę, esybių išgavimą (vardų, datų ir skaičių identifikavimą kalboje) ir kalbos generavimą. Balso DI srityje NLP yra sluoksnis tarp kalbos transkripcijos ir prasmingo veiksmo - tai leidžia DI suprasti, kad „gal galėtumėt man laiko duot ketvirtadienį po pietų" reiškia, jog klientas nori vizito ketvirtadienio popietę.
Nuosavybės valdymo sistema (PMS)
PMS (angl. Property Management System) - tai pagrindinė programinė įranga, kurią viešbučiai ir apgyvendinimo verslai naudoja rezervacijoms, kambarių inventoriui, svečių profiliams, atsiskaitymams ir ūkio tarnybai valdyti. Populiarios PMS platformos: Opera, Mews, Cloudbeds ir Little Hotelier. Kai DI balso agentas integruojamas su PMS, jis gali tikrinti prieinamumą realiu laiku, kurti rezervacijas ir pasiekti svečių istoriją skambučio metu. PMS integracija leidžia DI viešbučio recepcijai savarankiškai tvarkyti visą rezervacijos procesą.
O-R
Daugiakanalis aptarnavimas (Omnichannel)
Daugiakanalis aptarnavimas (angl. Omnichannel) - tai vieninga klientų aptarnavimo strategija per visus komunikacijos kanalus: telefoną, el. paštą, pokalbių langą, SMS, socialinius tinklus ir gyvai. Omnichannel aplinkoje klientas, pradėjęs pokalbį per pokalbių langą ir paskui paskambinęs telefonu, neturi kartoti savo informacijos. DI sistemos su daugiakanale galimybe išlaiko kontekstą per visus kanalus, sukurdamos sklandžią patirtį, nepriklausomai nuo to, kaip klientas kreipiasi.
Pokalbių robotas (Chatbot)
Pokalbių robotas - tai programinė įranga, kuri veda tekstinius pokalbius, dažniausiai svetainėse, žinučių programėlėse ar socialiniuose tinkluose. Pokalbių robotai gali būti nuo paprastų taisyklėmis paremtų sistemų iki DI valdomų asistentų, kurie supranta kontekstą ir generuoja dinaminius atsakymus. Tačiau pokalbių robotai negali tvarkyti telefono skambučių ar balso sąveikų. Verslams, gaunantiems daug skambučių, svarbu suprasti skirtumus tarp pokalbių robotų ir DI balso asistentų.
Paieška papildyta generacija (RAG)
RAG (angl. Retrieval-Augmented Generation) - tai technika, kuri pagerina DI tikslumą sujungdama kalbos modelį su paieškos sistema. Užuot pasikliavus vien tuo, kuo LLM buvo apmokytas, RAG realiu laiku suranda atitinkamus dokumentus ar duomenis iš jūsų verslo žinių bazės, o tada naudoja tą informaciją atsakymui generuoti. Tai drastiškai sumažina haliucinacijas, nes DI grindžia savo atsakymus patikrintais, aktualiais duomenimis. Pavyzdžiui, kai skambinantysis klausia apie atšaukimo politiką, RAG užtikrina, kad DI cituoja jūsų tikrąją politiką, o ne improvizuoja.
Realaus laiko API
Realaus laiko API (angl. Real-time API) - tai programavimo sąsaja, kuri apdoroja duomenis su minimaliu vėlinimu, leidžiančiu momentinę sąveiką. Balso DI srityje realaus laiko API (pavyzdžiui, OpenAI Realtime API) leidžia kalbą transliuoti tiesiai į DI modelį, o atsakymus - atgal, pašalinant paketinio apdorojimo vėlinimus. Būtent tai daro šiuolaikinius balso DI pokalbius natūralius - atsakymo laikas pakankamai greitas, kad skambinantysis jaustų, jog DI kalba realiu laiku.
S-T
SIP protokolas
SIP (angl. Session Initiation Protocol) - tai standartinis protokolas, naudojamas balso skambučiams internetu (VoIP) inicijuoti, palaikyti ir nutraukti. Kai DI balso agentas atsiliepia į telefono skambutį, SIP tvarko ryšį tarp telefono tinklo ir DI sistemos. SIP magistralė (trunk) leidžia verslams prijungti DI prie esamų telefono numerių ir PBX sistemų nekeičiant infrastruktūros.
Skambučio peradresavimas (Transfer)
Skambučio peradresavimas - tai procesas, kai DI perduoda aktyvų telefono skambutį žmogui-darbuotojui. Geros DI sistemos atlieka „šiltą perdavimą" - perduoda pokalbio santrauką, kad žmogus nereikėtų skambinančiojo prašyti kartoti viską iš naujo. Peradresavimo galimybė yra būtina, nes joks DI negali suvaldyti kiekvienos situacijos. Geriausi DI balso agentai atpažįsta, kada užklausa viršija jų galimybes, ir sklandžiai nukreipia skambutį su pilnu kontekstu tinkamam komandos nariui.
Kalba į tekstą (STT)
Kalba į tekstą (angl. Speech-to-Text, taip pat vadinama ASR) - tai procesas, kurio metu ištartas garsas paverčiamas rašytiniu tekstu. STT yra bet kurios balso DI sistemos įvesties sluoksnis. Skambinantysis kalba, STT perrašo žodžius, ir DI apdoroja tekstą. STT tikslumas priklauso nuo kalbos, akcento ir garso kokybės. Verslams, dirbantiems daugiakalbėje aplinkoje, STT, kuris tiksliai atpažįsta tokias kalbas kaip lietuvių, yra esminis.
Tekstas į kalbą (TTS)
Tekstas į kalbą (angl. Text-to-Speech) - tai technologija, kuri paverčia rašytinį tekstą ištartu garsu. TTS yra balso DI sistemos išvesties sluoksnis: DI sugeneruoja tekstinį atsakymą, o TTS paverčia jį natūraliai skambančia kalba. Šiuolaikinės TTS sistemos kuria balsus, kurie beveik neatskiriami nuo žmogaus kalbos, su tinkama intonacija, tempu ir net emociniu atspalviu. TTS kokybė tiesiogiai veikia, kaip skambinantieji suvokia DI. Norėdami suprasti skirtumą, perskaitykite ar DI tikrai gali kalbėti kaip žmogus.
V-Ž
Užklausa (Prompt)
Užklausa (angl. Prompt) - tai instrukcija ar kontekstas, pateikiamas DI modeliui, kad nukreiptų jo elgesį. Balso DI srityje sisteminė užklausa apibrėžia DI asmenybę, žinių ribas, taisykles (ką gali ir ko negali sakyti) bei darbo procesus. Gerai sukurta užklausa yra tai, kas leidžia DI balso agentui skambėti taip, lyg jis priklauso būtent jūsų verslui, o ne generiškai. Užklausų inžinerija (Prompt engineering) - tai iteracinis šių instrukcijų tobulinimo procesas.
Vėlinimas (Latency)
Vėlinimas - tai laiko tarpas nuo tada, kai skambinantysis baigia sakinį, iki tada, kai DI pradeda atsakyti. Balso DI srityje mažas vėlinimas yra kritiškai svarbus natūraliam pokalbiui. Jei DI trunka ilgiau nei 500-800 milisekundžių atsakyti, pokalbis jaučiasi nenatūraliai, ir skambinantieji gali pradėti kartoti arba padėti ragelį. Vėlinimas priklauso nuo visos grandinės: kalbos atpažinimo greičio, LLM apdorojimo laiko ir teksto pavertimo kalba spartos. Geriausios sistemos pasiekia mažiau nei 500ms nuo pradžios iki galo. Plačiau - mūsų techninis balso DI paaiškinimas.
Balso DI (Voice DI)
Balso DI - tai bendras terminas dirbtinio intelekto sistemoms, kurios sąveikauja šnekamąja kalba. Jis apima visą technologijų grandinę: kalbos atpažinimą (ASR/STT), natūralios kalbos supratimą (NLP), atsakymų generavimą (LLM) ir kalbos sintezę (TTS). Balso DI valdo programas nuo išmaniųjų garsiakalbių iki telefonu grįsto klientų aptarnavimo. Verslo kontekste Balso DI paprastai reiškia sistemas, kurios tvarko telefono skambučius ir balso sąveikas įmonės vardu. Apsilankykite mūsų paslaugų puslapyje ir sužinokite, kaip balso DI taikomas realiems verslo scenarijams.
Balso valdiklis (Voice Widget)
Balso valdiklis - tai įterpiama sąsaja, leidžianti svetainės lankytojams bendrauti su DI balso agentu tiesiogiai iš tinklalapio. Vietoj to, kad DI siūlytumėte tik per telefono skambučius, balso valdiklis prideda mikrofono mygtuką jūsų svetainėje, kur lankytojai gali užduoti klausimus balsu ir gauti ištartus atsakymus. Tai sujungia tekstinį pokalbių langą su telefonu grįstu balso DI. Sužinokite daugiau apie tai, kaip veikia mūsų technologija telefone ir internete.
Webhook (tinklo kabliukas)
Webhook - tai automatinė žinutė, siunčiama iš vienos sistemos į kitą, kai įvyksta konkretus įvykis. Balso DI srityje webhook naudojami veiksmams po skambučių: santraukos siuntimui el. paštu verslo savininkui, CRM įrašo sukūrimui, vizitų kalendoriaus atnaujinimui arba komandos nario informavimui apie skubią užklausą. Webhook yra jungiamasis audinys, sujungiantis DI balso agentą su kitais jūsų verslo įrankiais, leidžiantis visapusę automatizaciją, o ne tik pokalbių tvarkymą.
Žetonas (Token)
DI srityje žetonas (angl. Token) - tai bazinis teksto vienetas, kurį apdoroja kalbos modeliai. Žetonas gali būti žodis, žodžio dalis arba skyrybos ženklas. Pavyzdžiui, žodis „supratimas" gali būti padalintas į du žetonus: „suprat" ir „imas". Žetonai svarbūs dėl dviejų priežasčių: jie nulemia, kiek konteksto DI gali apdoroti viename pokalbyje (vadinamas „konteksto langas"), ir jie yra DI naudojimo matavimo ir apmokestinimo vienetas. Sudėtingesni pokalbiai reikalauja daugiau žetonų.
Žinių bazė
Žinių bazė - tai struktūrizuota informacijos kolekcija, iš kurios DI sistema semiasi atsakydama į klausimus. Verslo DI atveju tai paprastai apima siūlomas paslaugas, kainas, darbo valandas, vietos informaciją, politikas (atšaukimo, grąžinimo ir kt.) ir atsakymus į dažniausiai užduodamus klausimus. Žinių bazės kokybė tiesiogiai lemia DI atsakymų kokybę. Gerai prižiūrima žinių bazė yra skirtumas tarp DI, kuris skamba kompetentingai, ir DI, kuris skamba generiškai.
Kaip naudoti šį žodyną
Tai gyvas dokumentas. DI technologijai tobulėjant, pridėsime naujų terminų ir atnaujinsime esamus apibrėžimus. Jei sutiksite terminą pokalbiuose su DI tiekėjais, kurio čia nematote, susisiekite su mumis - ir mes jį pridėsime.
Dažnai užduodami klausimai
Pokalbių robotas bendrauja tekstu svetainėse ar žinučių programėlėse. DI balso agentas bendrauja šnekamąja kalba per telefono skambučius. Nors abu naudoja DI supratimui ir atsakymams, balso agentams reikia papildomų technologijų sluoksnių: kalbos atpažinimo (garsas į tekstą) ir teksto pavertimo kalba (atsakymo pavertimas garsu). Balso agentai tvarko telefono kanalą, kurio pokalbių robotai nepasiekia.
Ne. Jums nereikia suprasti techninių detalių, kad gautumėte naudos iš DI. Tačiau bazinių žinių turėjimas padeda užduoti geresnius klausimus vertinant tiekėjus, suprasti, už ką mokate, ir priimti labiau informuotus sprendimus. Tai panašu kaip su automobilio mechanika: jums nereikia būti inžinieriumi, bet žinoti, kas yra pavarų dėžė, padeda bendrauti su meistru.
RAG reiškia „paieška papildyta generacija“ (Retrieval-Augmented Generation). Tai technika, kai DI ieško konkrečių jūsų verslo duomenų prieš generuodamas atsakymą, užuot pasikliavęs vien savo apmokymu. Tai svarbu, nes drastiškai sumažina haliucinacijas (neteisingą informaciją) ir užtikrina, kad DI pateikia atsakymus pagal jūsų tikrąsias paslaugas, kainas ir politikas, o ne kuria dalykus.
Vėlinimas matuojamas milisekundėmis nuo tada, kai skambinantysis baigia kalbėti, iki tada, kai DI pradeda atsakyti. Mažiau nei 500 milisekundžių jaučiasi natūraliai ir pokalbiškai. Tarp 500-800ms yra priimtina, bet pastebima. Daugiau nei 1 sekundė sukuria nepatogias pauzes, kurios blogina skambinančiojo patirtį. Geriausios balso DI sistemos nuosekliai pasiekia mažiau nei 500ms vėlinimą.
Šios trys technologijos sudaro bet kurio balso DI skambučio pagrindą. STT (kalba į tekstą) paverčia skambinančiojo ištartus žodžius tekstu. LLM (didelis kalbos modelis) apdoroja tą tekstą, supranta ketinimą ir sugeneruoja tekstinį atsakymą. TTS (tekstas į kalbą) paverčia atsakymo tekstą natūraliai skambančia kalba. Šis trijų žingsnių procesas vyksta realiu laiku, paprastai per mažiau nei 500 milisekundžių.
AInora steigėjas ir vadovas
Kuriu AI skaitmeninius administratorius, kurie pakeičia registratūros darbuotojus paslaugų verslams visoje Europoje. Anksčiau kūriau balso AI sistemas odontologijos klinikoms, viešbučiams ir restoranams.
Visi straipsniaiPasiruošę išbandyti AI savo verslui?
Išgirskite, kaip AInora skamba tvarkydama tikrą verslo skambutį. Išbandykite balso demo arba užsirezervuokite konsultaciją.
Susiję straipsniai
Kas yra DI balso agentas? Pilnas vadovas verslo savininkams
Viskas, ką reikia žinoti apie DI balso agentus: kaip jie veikia, kiek kainuoja ir ar tinka jūsų verslui.
Kaip veikia DI balso technologija: 3 žingsnių paaiškinimas
STT-LLM-TTS grandinė paaiškinta paprastais žodžiais su schemomis ir realiais pavyzdžiais.
Pokalbių robotas vs DI balso asistentas: 5 pagrindiniai skirtumai
Kodėl paslaugų verslams reikia balso DI, o ne svetainės pokalbių roboto.
Kas yra DI skaitmeninis administratorius?
Kaip skaitmeniniai administratoriai viršija balso agentus ir tvarko visus administracinius darbo procesus.