Text To Speech - 9 ok, amiért szintlépés az ügyfélélményben!

Bokros Márk2022.10.13.

A cím talán túlzó, viszont a Text To Speech (TTS) - azaz a beszédszintézis – sokat segíthet egy ügyfélszolgálat működtetésében. Természetesen vannak olyan speciális területek mit például látássérültek való kommunikáció, ahol új lehetőséget nyit vagy a például az autók üzenet felolvasó kényelmi funkciói amelyek terjedése segít a gépi hangtól való idegenkedés leküzdésében. Ez a bejegyzés viszont nem ezekre a megoldásokra, hanem az ügyfélszolgálati önkiszolgáló hangmenüre azaz IVR-okra koncentrál, ahol sok esetben még statikus, az üzemeltetők által rögzített, változó minőségű és aktualitású hangokkal találkozhatunk. Na de hogyan is segít a Text To Speech nekünk ennek javításában és mit is várhatunk el tőle?

1.    Kiterjedt nyelvi támogatással rendelkezik

A mai cloud Text To Speech-en alapuló megoldások már nem csak a világnyelveket „beszélik” elfogadható szinten, hanem például a mi régiónk nyelveit is beleértve természetesen a magyart.  A támogatott nyelvek száma és a minőség előrelépés az on-prem rendszerekhez képes. Természetesen nagyobb kezdeti ráfordítással ma is lehet on-prem rendszerünk, de ebben az esetben nem várhatjuk azonos fejlődési sebességet, amit a cloud rendszereknél tapasztalunk.

2.    Van tulajdonnév szótár

Az eddigi felhasználók első tesztjei között szerepelt a tulajdonnevek felolvasásának tesztje, amit a korai rendszerek nagyon szerény eredménnyel teljesítettek. Ma már nem kell aggódnunk a címek, tulajdonnevek kiolvasása miatt, van olyan megoldás, amit használva akár még rettegett Batthyány tér nem probléma többé. Vagy ha mégis találunk, akkor összesen egyszer kell felvinni a saját kivételeink közé.

3.    Text To Speech = egységes hang

Végre ugyanolyan sebességű, minőségű és hangszínű a hang lesz az egész ügyfélszolgálaton. Ehhez nem szükséges megvárni például kellemes hangú kolléga szabadságának, torokgyulladásból való felgyógyulását, vagy szerződtetett hangunkat időpontot egyeztetni és/vagy hangot szerkeszteni.

4.    Gyors bevezetés

Ha már van egy szövegkönyvünk a meglévő tartalommal gyorsan és hatékonyan lehet cserélni a konzerv hangokat. Másodpercek alatt generálható vagy módosítható, a megfelelő formátumban exportálható a hangfájl.

5.    Finomhangolható

Módosítható a sebesség, hangerő, fájlformátum. Változtathatunk a mondatok, mondatrészek, vagy akár a kifejezések, szavak közötti szüneteken, amivel érthetőbbé és kevésbé gépies érzetűvé tehetjük az automatánkat. Vannak olyan nyelvek több hangból is választhatunk, sőt akár lehet saját hangunk is (a magyar ma még nincs ezek között).

6.    Testre szabható, tanítható

Az újonnan bevezetett megoldásunk természetesen nem lesz hibátlan. Biztosan van olyan betűszó, terméknév, szókapcsolat, ami nem abban a formában terjedt el ahogy a rendszerünk mögött dolgozó AI vezérelt szótár azt tartalmazza. Ilyenkor sincs gond, kivételként felvehetjük ezeket a kifejezéseket, a kimondást segítő javaslatokat adhatunk a motorunknak.

7.    Dinamizálható tartalmak

Nem csak előre rögzített tartalmú hangokat tudnunk lejátszani. A Text To Speech másodperces reakcióidővel – ezen a felhasználási területen valós időben - képes szavakat vagy akár egész mondatatokat is előállítani. A szolgáltatás lokálisan telepített ügyfélszolgálattal való összekötéséhez W3C ajánlásban megfogalmazott SSML specifikáció áll rendelkezésre már 2010 óta, így az elterjedt IVR rendszerekkel összeköthető. Hátrányként itt meg kell említeni a cloud megoldások használata alapú árazását, azaz a nagy mennyiségű dinamikus tartalom magas számlát eredményez a hónap végén.

8.    Azonnali reakció lehetősége

Az előző pontokból következik, hogy a Text To Speech-et használva sokat javíthatunk a CallCenter hangmenünk váratlan eseményekre való reagálási képességén. A statikus, vis major helyzeteket egy-két bekészített konzerv hanggal támogatott működéshez képest nagy előrelépést jelenthet, ha az érintett eseményre reagáló hang fogadja az ügyfeleket a CallCenterben.  

9.    Lépést teszünk a hangvezérelt IVR felé

Mára a chatbotok velünk vannak az ügyfélszolgálati kommunikációban. Egy hasonló elven működő ügyfélszolgálati voicebot használatának megfontolása ott kell legyen egy nagyobb CallCenter középtávú fejlesztési tervei között, aminek előfeltétele a Text To Speech és természetesen Automatic Speech Recognition (ASR) megléte. E kettő a legtöbb szolgáltatónál egy szolgáltatási csomagban érhető el, azaz az utóbbi is bármikor rendelkezésünkre áll.

A felsoroltak megmutatják, hogy a hangok kezelésének feladatát továbbra sem lehet megúszni humán erőforrás felhasználása és anyagi ráfordítás nélkül. Viszont az is láthatjuk, hogy bár megjelentek új kommunikációs csatornák (amelyeket már generációk preferálnak a telefonhívással szemben), az ügyfelek jelentős része továbbra is hívják a telefonos ügyfélszolgálatokat. Sőt, részben a pandémiának is köszönhetően a személyes ügyfélszolgálatoktól átvett új feladatok és lehetőségek hívásszám növekedést is okozhatnak. Így ma is fontos CallCenter ahol a Text To Speech, segíthet a szolgáltatásunk minőségének javításában és ezáltal az ügyfelek megtartásában is.

További bejegyzések

Azonos kategóriában:

© 2022 Bravonet Kft. All rights reserved | Adatvédelmi téjékoztató