Quell’agente che sembra essere di Parigi, in Texas? Prova Parigi, Francia – TechCrunch

La nostra vita quotidiana sono più legati che mai in una griglia globalizzata. I prodotti vengono acquistati e spediti da lontano; Viaggiare in un luogo a 3.000 miglia di distanza può essere più facile che attraversare una grande città nel traffico; e le informazioni si diffondono a chiunque ea tutti con il semplice tocco di un dito.

Una startup chiamata Sanas ha sviluppato una tecnologia vocale AI che mira a far funzionare più agevolmente un componente critico di quella griglia: come le persone che parlano la stessa lingua ma con accenti diversi possono capirsi meglio, filtrando le voci accentate e trasformando quegli accenti in effettivi tempo in altri. Oggi la startup annuncia un finanziamento di 32 milioni di dollari sulla scia di un forte slancio per i suoi strumenti in quanto esce dalla furtività e viene lanciato in modo più ampio.

Insight Partners guida l’investimento, con la partecipazione dei nuovi finanziatori GV (ex Google Ventures), del finanziatore strategico Assurant Ventures e dell’angelo investitore Gokul Rajaram. Anche i precedenti sostenitori del suo seed round Human Capital, General Catalyst, Quiet Capital e DN Capital partecipano a questa serie A. Insieme all’investimento, Sanas annuncia anche una partnership strategica con Alorica, uno dei più grandi BPO al mondo, che sta implementando la tecnologia a 100.000 dipendenti e 250 clienti aziendali in tutto il mondo.

La società non sta rivelando la valutazione, ma comprendiamo che si tratta di $ 150 milioni dopo il pagamento. Questa serie A è una delle più grandi per una startup di intelligenza artificiale vocale e, da quello che capiamo, arriva dopo che Sanas ha rifiutato un’offerta di acquisizione da parte della grande tecnologia. (Se non puoi comprarli, investici!)

Come avrai intuito dal suo elenco di tecnologie per gli investitori, Sana è già stato stabilito nei call center. In particolare, ha trovato molta trazione con i fornitori di servizi clienti distanti, che sono diventati un focolaio di abusi contro agenti che potrebbero parlare la stessa lingua di un cliente, ma fortemente accentati.

Oltre al gigante assicurativo Assurant e al leviatano BPO Alorica, altri clienti includono la grande società di agenzie di riscossione ERC e l’industria dei viaggi BPO IGT. In un triste commento sullo stato del nostro mondo, il CEO e co-fondatore di Sanas Maxim Serebryakov ha affermato che il risultato dell’utilizzo della tecnologia in questi luoghi è stato drammatico in termini di riduzione delle molestie degli agenti.

Il piano di Sanas consiste nell’utilizzare i finanziamenti sia per continuare ad espandere la propria attività in quel verticale sia per iniziare a prepararsi ad altri casi d’uso nell’impresa, ad esempio come plug-in per le videochiamate o per servizi interattivi basati sulla voce per aiutare le macchine (e i sistemi basati su ML) comprendono una gamma più ampia di accenti.

Serebryakov ha inizialmente co-fondato l’azienda con Shawn Zhang e Andrés Pérez Soderi, due compagni studenti del laboratorio di intelligenza artificiale di Stanford, dopo che un loro quarto amico aveva bisogno di lasciare la scuola e tornare nel suo paese natale, il Nicaragua, per trovare un lavoro per aiutare con un’emergenza familiare

L’amico ha accettato un lavoro in un call center a casa che serve clienti negli Stati Uniti, e anche se parlava perfettamente – e non meno uno studente che si prendeva una pausa da Stanford – ha subito infiniti abusi al telefono da parte di persone a cui non piaceva il suo accento.

Gli altri tre hanno capito fin troppo bene questo giudizio, risposta e abuso, essendo essi stessi immigrati di prima generazione (e aggiungo che lo so molto bene anche io in prima persona, sia nella mia vita attuale che crescendo come immigrato di prima generazione negli Stati Uniti). E così hanno deciso di mettere alla prova le loro conoscenze di intelligenza artificiale per vedere se potevano risolverlo. (All’inizio di quest’anno, Sanas ha anche preso un quarto co-fondatore, Sharath Keshava Narayana, che ora è anche COO e che ha lasciato un’altra società che ha co-fondato, Observe.AI, dopo aver appreso dell’azienda e aver voluto essere coinvolto nella costruzione esso.)

Ci sono tonnellate di strumenti là fuori oggi per “sintonizzare automaticamente” e modificare la voce di una persona in tempo reale o in tempo ritardato: a questo punto sono comuni quanto i filtri fotografici. Ma come osserva Serebryakov, è particolarmente difficile essere in grado di preservare la voce naturale e reale e cambiare il modo in cui dice ciò che sta dicendo.

È interessante notare che il problema è così astratto: Sanas si è avvicinato a risolverlo ingerendo migliaia di ore di discorso con accenti diversi in un sistema e ordinandolo per abbinarlo ad altri suoni, con l’intero mix di tecnologia e metodo ora anche in un brevetto processo — che il risultato finale è che il motore di “traduzione” dell’accento di Sanas può essere utilizzato con qualsiasi lingua, non solo con l’inglese come avresti potuto supporre. (Serebryakov mi dice che è già usato per “smussare” gli accenti in Giappone, Cina e Corea del Sud, per esempio.)

“Una tecnologia come questa è applicabile a livello globale, da un accento all’altro”, ha affermato. “Ci vorrà tempo, ma il nostro obiettivo è permettere alle persone di comunicare con qualsiasi accento”.

C’è un certo disagio attorno al concetto stesso di ciò che Sanas sta affrontando e facendo qui. Solleva molte domande su potenziali abusi e, a parte questo, alcuni potrebbero trovare sgradevole e superato che la tecnologia venga sviluppata specificamente per oscurare la vera identità di una persona: le persone che giudicano gli accenti non dovrebbero imparare ad essere più aperte di mentalità e di accettazione, piuttosto che le persone che per sempre accomodano i pregiudizi nascondendo tutto ciò che contrassegna gli altri come estranei o diversi?

Tuttavia, ci sono punti che argomentano contro questi. Sanas in particolare non sta creando applicazioni per i consumatori o rendendo loro la tecnologia accessibile al momento proprio a causa di come potrebbe essere utilizzata in modo improprio. Anche i suoi clienti non utilizzano una versione basata su cloud della tecnologia: per mantenere le cose estremamente sicure, si trova in locale e quindi i clienti controllano i propri dati che passano e vengono generati attraverso Sanas.

Da parte dell’oscuramento della vera identità, questo è sicuramente un problema più grande che tutti dobbiamo affrontare quotidianamente. Nel frattempo, questo sta dando a coloro che sono alla fine di quei jab un modo per far fronte meglio e, in alcuni modi molto pratici, rende più facile per le persone (anche coloro che sono semplicemente ben intenzionati) capirsi senza accenti mettersi in mezzo.

Ho avuto una demo del servizio durante la mia intervista, in cui Sanas ha telefonato a uno degli agenti dei loro clienti in India e lo ha convinto a chattare con me prima con il suo accento, e poi ha “acceso” il suo tono neutrale del Midwest. Era un po’ inquietante sapere cosa stava succedendo in background, ma in superficie sono rimasto molto sorpreso da quanto tutto sembrasse naturale, beh, abbastanza naturale, almeno. La sua voce era chiara, ma forse un po’ troppo chiara, e quasi un pochino robotica e priva di emozioni.

Apparentemente, anche questo è intenzionale per ora e potrebbe evolversi se è ciò che i clienti e gli altri utenti vogliono.

“Il motivo per cui ci concentriamo sui call center è che è un frutto di bassa portata”, ha affermato Serebryakov, osservando che le difficoltà di costruire ciò che è effettivamente una tecnologia rivoluzionaria era già abbastanza difficile, ma capita anche di adattarsi al caso d’uso. “Per noi durante la costruzione di questo, era importante seguire il percorso di minor resistenza. Niente canti, niente risate, niente discorsi iperemotivi. Quello che stiamo affrontando è che stiamo cercando di dare il controllo su come questi utenti interagiscono al lavoro”. Non ci sono pianti nel baseball, e nemmeno divertimento e giochi nel call center.

“Insight Partners è entusiasta di approfondire la sua relazione con Sanas su una tecnologia così all’avanguardia e trasformativa”, ha affermato Ganesh Bell, MD di Insight, in una dichiarazione. “Mentre l’azienda esce dalla sua fase invisibile, non vedo l’ora di lavorare con questo team immensamente talentuoso e appassionato per costruire un prodotto che, tra le molte cose, aiuterà a eliminare gli sfortunati pregiudizi e discriminazioni vissuti da coloro che parlano inglese come un secondo lingua, che include molti dei dipendenti di Sanas”.

Leave a Comment