UI: come progettarla per un assistente vocale
La UI (interfaccia utente, dall’inglese user interface) di un assistente vocale non è un dettaglio banale. Negli ultimi anni le nostre abitazioni e i nostri uffici hanno visto tra i loro spazi comparire sempre più un nuovo accessorio elettronico, gli smart speaker.
UI di un assistente vocale: cos’è uno Smart Speaker?
Gli smart speaker, conosciuti anche come assistenti vocali sono dei diffusori audio, che potrebbero inizialmente assomigliare a delle semplici casse musicali ma in realtà sono dei dispositivi pensati per la casa, collegati ad un cervello centrale che ascolta le richieste vocali del suo proprietario, le interpreta e le esegue: dalle telefonate, alla lettura di news e posta, fino alla riproduzione di brani musicali.
Un assistente vocale permette di poter chiedere informazioni di qualsiasi tipo. Si può fissare un appuntamento, fare l’elenco della spesa, chiedere le informazioni su traffico o meteo e in molti casi anche comandare i dispositivi smart della casa.
Insomma è a tutti gli effetti un assistente.
Come ogni buon “nuovo giocattolo” che si rispetti, trovandosi anche a prezzi modici (vanno dai 40 ai 100 euro circa), sono stati molti gli utenti spinti a provare la novità, e nel giro di 2/3 anni secondo alcuni studi ormai un americano su quattro possiede almeno uno smart speaker.
Questi numeri indicano che tale mercato sta crescendo sempre più, ma cosa significa esattamente?
UI di un assistente vocale: cosa si aspettano gli utenti?
Essendo una tecnologia ancora molto giovane e dal futuro incerto, il modo migliore per acquisire chiarezza è cercare di capire e studiare i comportamenti, i bisogni e le aspettative degli utenti.
Quello che si evince da subito è che le persone stanno ancora cercando di comprendere il pieno potenziale degli altoparlanti intelligenti e in che modo si stanno evolvendo le possibili interazioni. Questo genera anche molte aspettative sul superamento di alcuni limiti attuali.
Le persone vogliono che un assistente vocale sia amichevole, ma non troppo amichevole. Sebbene sia possibile umanizzare gli assistenti vocali aggiungendo accenti o emozioni, le persone non vogliono che i dispositivi abbiano una presenza imprevista o imponente nelle loro vite.
Gli smart speaker potrebbero cambiare le nostre abitudini, rimuovendo l’intermediazione dell’interfaccia grafica e lasciando il potere alla selezione vocale, perlomeno in casa.
Ma ovviamente passare da una concezione ed esperienza maggiormente visiva ad una che esclude l’apporto di immagini o simili e utilizza solo l’audio, non è per niente facile.
UI di un assistente vocale: i vantaggi di uno Smart Speaker.
Per quanto siamo ancora agli inizi di questa tecnologia e quindi non ne comprendiamo ancora a pieno le potenzialità, vi sono già alcuni vantaggi che risultano facili da identificare:
1. Ottimo per le persone con handicap. Pensate ad esempio ad una persona non vedente, L’assistente vocale facilita notevolmente l’interazione con la tecnologia e non solo. “Leggere “ ricette e “guardare” diventerà in entrambi i casi “ascoltare”.
2. Parlare è più veloce che tappare. Be questo punto è comprensibile da se.
3. La voce permette di avere le mani libere, gli occhi liberi ed è omnidirezionale. Si tratta di un grande vantaggio. Questo permetterà agli utenti di poter svolgere più azioni nello stesso momento e per una volta forse anche noi uomini potremmo sfatare il mito di non essere multitasking.
4. Gli smart speaker sono più economici. Questo è un vantaggio puramente materiale, ma dati i prezzi che hanno ormai raggiunto da anni gli smartphone, non è un fattore da sottovalutare.
5. Cambia il device ma la UX rimane uguale. Vantaggio ottimo sia per il progettista che per l’utente.
UI di un assistente vocale: le sfide progettuali più difficili da affrontare.
Bene, per capire quali sono le difficoltà maggiori che un progettista dovrà sicuramente affrontare qualora volesse realizzare una VUI (vocal user interface), prendiamo ad esempio uno scenario:
Ci troviamo a casa e, essendo dopo cena, il nostro smart speaker pone una domanda.
S.S “ Vuoi un caffè?” Utente “Macchiato, grazie”
Cosa è successo in questo momento? L’utente ha dato una risposta per lui corretta e immediata, che però non va bene per lo speaker.
Questo perché le persone quando parlano usano anche la conoscenza del contesto per creare un significato condiviso che molto spesso non viene quindi rappresentato a parole, ma semplicemente a gesti o anche con il tono della voce.
La risposta dell’utente non conteneva una risposta per lo smart speaker , ovvero “Sì” o “No”, ma un’osservazione delle sue abitudini che sottointende una risposta che un’altra persona avrebbe compreso.
Quindi la prima difficoltà sta proprio nel tipo di comunicazione. Le persone quando parlano utilizzano un linguaggio colloquiale, che molto spesso è pieno di sinonimi, abbreviazioni, ma soprattutto di segni, smorfie, cambio di tono, insomma di linguaggio non verbale. Di conseguenza lo smart speaker avrà grosse difficoltà a recepire una risposta e quindi quasi sempre risponderà “Mi spiace non trovo nessun risultato”.
Qui subentra la seconda difficoltà, la frustrazione dell’utente.
Quante volte vi è capitato di ricercare qualcosa online tramite qualche device e nonostante riprovaste più volte il risultato era sempre nullo? E cosa succedeva dopo?
“È inutile, non serve a niente” e quindi smettevate di usare quell’apparecchio.
Da questa breve analisi possiamo trarre alcuni consigli.
UI di un assistente vocale: alcuni consigli per una buona progettazione.
Arrivati a questo punto possiamo dare alcuni consigli per iniziare a progettare una VUI:
1. Progetta per come le persone parlano realmente, non per come vorresti che parlassero; il motivo di questo lo abbiamo spiegato poco fa, gli utenti non parlano come scrivono ma soprattutto non capiscono che davanti hanno una macchina e non una persona e di conseguenza dovrebbero dare delle informazioni più semplici e precise.
2. Non provare a fare tutto in una sola volta, analizza scenario per scenario, ma soprattutto conversazione per conservazione e step by step. Soffermati su ogni singola possibile interazione, e cerca di fare poco ma bene. Meglio fare poche interazioni che funzionano, piuttosto che tante ma non perfettamente funzionanti.
3. Non esistono errori. Ogni conversazione, anche se l’utente non comunica perfettamente con il device, deve sempre avere uno sbocco, una via d’uscita. Lo smart speaker deve avere solo due tipi di risposte “Sì/No” oppure “E/O”; evitare il più possibile di incorrere nel “Non trovo nessun risultato, mi spiace” di cui parlavamo poco prima, proprio per evitare la frustrazione dell’utente.
4. Conferma quando un task è completo. Questa è una tip che è bene usare anche nella creazioni di classiche UI visive, dare un feedback dell’avvenuto completamento di un task è fondamentale. Pensate se un utente chiedesse al suo smart speaker di spegnere le luci in cucina quando lui magari si trova bello comodo a letto stanco dopo una giornata di lavoro. Qualora non ci fosse un semplice “Luci della cucina spente” l’utente non avrà mai la certezza e sicurezza che il suo comando sia andato a buon fine, e quindi per controllare dovrà per forza alzarsi ed andare personalmente in cucina.
In conclusione voglio consigliarti due siti che ti saranno sicuramente utilissimi per approfondire questo argomento.
Il primo è senza ombra di dubbio quello di Amazon Alexa, qui si trova veramente di tutto, da articoli a builder per le cosiddette skills (le app per gli speaker vocali). Il secondo è Voiceflow, ad ora forse il miglior tool per progettare voice apps.