Oct 16 2004
Natural Interface: interfacce antropocentriche per l’era post mouse

Nel 1988 alla Apple Computer -famosa per il suo Macintosh- produssero alcuni
videoscenari dove mostravano come i computers del futuro sarebbero stati in
grado di interpretare i movimenti delle mani, leggere dei testo, e rispondere
ai comandi vocali. (Tratto dallo Speech del 12/10/04 al NUI)
In questa pagina
- Introduzione
- La prima dote di un assistente è la RICERCA
- I tre pilastri delle interfacce & le interfacce naturali
- Computer comandati con lo sguardo
- CONCLUSIONI: Ma chi ha bisogno di un nuovo computer?
Nei video-scenari che la Apple produsse tra il 1987 ed il 1989 è una la cosa che mi ha sempre colpito: l’azienda
che ha spiegato al mondo cosa fosse il mouse, pensava che nei computer del
futuro il mouse NON avrebbe trovato posto.
Così, il Knowledge Navigator -probabilmente il primo
tabletPC della storia- si accendeva con un gesto (aprendolo fisicamente), riconosceva/rispondeva
a voce ed era dotato di uno schermo sensibile alla pressione.

Subito dopo, nel video-scenario Future-Shock,
il computer era un semplice schermo trasparente (per certi versi simile alla
ultima incarnazione dell’iMac disegnata da Ive) che prevedeva il riconoscimento
dei gesti e dei comandi vocali.

In questa rivoluzione senza mouse, l’uomo comunica finalmente
in modo naturale e non attraverso orpelli e input-device prodotti da/per i
computer. Questo radicale cambio di paradigma di interazione non varebbe a
nulla se non risultasse un abilitatore utile a "rendere possibili
fare cose diverse da prima". Ecco quindi che il concetto di assistente digitale
-una sorta di segretario a cui affidare la gestione di ogni nostro file digitalizzato-
conquista centralità nei concept di Apple. E da allora, stiamo ancora aspettando.
I video-scenari sul web (solo lentissimi ed in solo download):
-
Knowledge
Navigator (14,1Mb) - Future
Shock (45Mb)
La prima dote di un assistente è la RICERCA
Nel web, oggi c’è un solo vero Re, e questo
è GOOGLE.
Questo era in qualche modo prevedibile, perché l’accesso rapido e l’organizzazione
alla conoscenza -primo passo verso l’emersione di comportamenti "intelligenti"-
passa attraverso la nostra capacità di ritrovare le informazioni.
La capacità di RICERCA è quindi il primo stadio del problema del trattamento
della conoscenza nell’era del web. Il punto è che l’input device e la modalità
con cui ci è consueto interagire con i computer non è la voce o il riconoscimento
dei gesti, ma il mouse e le finestre di windows e MacOS.
Ebbene, gestire la crescente complessità del gestire le informazioni residenti
sui nostri PC e nella Rete con strumenti così primitivi sta diventando IL PROBLEMA,
ed introdurre un motore di ricerca dentro ai sistemi operativi è la prossima
sfida (ancora una volta guidata dalla Apple).
SpotLight
Il nuovo strumento di ricerca system-wide di Tiger (Mac OS X 10.4),
aiuta gli utenti a trovare tutto ciò che cercano sul loro Mac. Spotlight è in
grado di trovare messaggi e-mail, calendari e contatti, oltre a dati, filmati,
immagini… ogni tipo di documento, insomma.
I risultati di Spotlight vengono
mostrati in categorie intuitive che aiutano a navigare, scegliere e infine fare
clic sull’informazione
desiderata.

Nel vedere screenshot, presentazioni e nel fare il test di SpotLight io ho provato
una duplice emozione. Da un lato mi sono detto:"finalmente!". Finalmente potrò
non curarmi di DOVE registro i files, di COME li chiamo (visione computer-centrica)
e pensare solo al loro contenuto o a quando li ho prodotti (visione un po’ più
umana).
Dall’altro lato mi sono anche detto:"Quanto è complicato!".
Si perché SpotLight,
che pure è semplice da usare, stressa fortemente l’uso di menu, search
box, pop-up etc. Ovvero tutte quelle componenti dell’interfaccia che definisco
"interattori di
basso livello" e quindi più complessi.
Insomma, dal mio punto di vista SpotLight è una benedizione, ed il suo limite
è -in realtà- il limite con cui -tutte le interfacce grafiche basate sulla metafora
del desktop- stanno facendo i conti. - SpotLight
sul sito Apple.
Nota: Forse pensate che -in realtà- la ricerca sul desktop possa trovare
altre strade e che -forse- è soltanto SpotLight a non essere progettato
adeguatamente. Beh,provate a scoprire SE e COME il prossimo successore di Windows
XP cercherà di
risolvere il problema, e scoprirete che SportLight è già migliore
delle promesse di Redmond.
D’altro canto, la vera soluzione potrebbe nascere da chi di Sistemi Operativi
non dovrebbe saperne molto, ma di ricerca se ne intende parecchio: Google.
Google
DESKTOP SEARCH è un software che consente di avere sul proprio PC tecnologia
Google usata per la di ricerca sul Web. Screenshot

Google Desktop Search consente di ricercare contenuti prodotti con le principali
applicazioni (al momento SOLO quelle targate Microsoft) e pone la società di
Google in concorrenza diretta con Microsoft. D’altro canto, Bill Gates & soci,
stanno tentando di insidiare la supremazia di Google nel business dei motori
di ricerca…
La ricerca viene presentata da un’interfaccia web attraverso il browser di default
del sistema. Il server
google utilizza un indirizzo locale 127.0.0.1 e la porta 4664 per svolgere
le sue funzioni di ricerca nella macchina. Dal punto di vista di Microsoft,
un temibile parassita che si annida nel centro del suo sistema operativo. …per
cui la guerra che potenzialmente porta al primo assistente digitale, è ufficialmente
aperta.
Bene,
Nonostante le mirabolanti promesse di SpotLight, Google Desktop Search, etc
(anche in termini di semplicità d’uso)… io non credo che fosse questo
il "futuro" a cui pensavano i ricercatori del PARC che hanno inventato
le interfacce grafiche, o il team Macintosh che le ha perfezionate e rese utili
alla gente. Insomma, questa roba continua ad essere troppo complicata. SI arrovella
sul limite intrinseco della metafora del desktop ed è prigioniera di
un input-device-carceriere chiamato MOUSE!
I tre pilastri delle
interfacce & le interfacce naturali
La tesi di questo paragrafo è la seguente: Il
mouse non soltanto determina gli aspetti propri della relazione uomo
macchina, ma influenza pesantemente anche gli aspetti applicativi e -più in
generale- lo sviluppo dell’informatica. Contemporaneamente, a cominciare dalle
interfacce pubbliche prodotte dall’italianissimo Alessandro Valli, mi mostrerò
come è possibile dimenticarsi del mouse e vivere ugualmente felici.
Una personale (e dunque opinabile) rilettura della letteratura in fatto di
Human Computer Interaction, mi ha convinto del fatto che una interfaccia sia
composta da "n" diversi fattori determinati dalla "macchina", dall’uomo, dal
contesto, dal compito, etc. L’approccio olistico dell’Interaction Design. …Ma
se dovessi parlare dell’interfaccia nei termini di ciò che quotidianamente
progetto, allora non esiterei a definire l’interfaccia (come suggeritomi dall’articolo dell’ottimo Paolo Salone) un sistema che
si basa su tre principali pilastri:
- Input Device (ovvero lo strumento con cui concretamente
vengono mediati i nostri comandi
diretti alla macchina)
- Tecnica di Interazione (ovvero quelle modalità operative di base che mi consentono
-attraverso l’input device- di compiere operazioni specifiche)
- Compito (scopo ultimo dell’azione che l’utente può raggiungere
attraverso l’uso della macchina)
Dal mio punto di vista:
In prima istanza il compito complesso è determinato
dalla somma delle varie azioni rese possibili dalle tecniche di interazioni
disponibili, e dato che queste dipendono in modo diretto dall’Input device,
quest’ultimo è la misura -sia in senso negativo che positivo- di ciò che è
possibile fare con una certa tecnologia. Ed in effetti, aldilà di ogni ragionamento
accademico, ciò che le persone percepiscono di una qualsivoglia tecnologia
informatica è -in prima istanza- la sua interfaccia.

Può dunque darsi che il mouse sia il segno dei computer del presente e l’interazione
naturale quella dei computer del futuro?
Beh, questa è pressapoco la mia tesi. D’altro canto vi immaginate
SpocK & Kirk che -mentre viaggiano con la loro Enterprise- armeggiano con dei
mouse? e HAL2000 con il mouse? BladeRunner con i mouse? Il Millennium Falcon? Fateci
caso: in nessun modello di futuro vorremmo portare con noi il mouse. …è un
fatto che dovremmo far valutare da uno psichiatra, ma è così.
Questo -probabilmente- perché il mouse NON E’ MAI STATO una tecnologia
antropocentrica ed usabile.
Al mouse ci siamo abituati strada facendo, ma
la gestualità ed il coordinamento occhio-mano che ci obbliga di sviluppare,
non può essere definito “naturale” (al punto che nelle generazioni
meno giovani la vera difficoltà nell’uso del PC è data
proprio dalla mancanza di un adeguato coordinamento).
Il “buono” del
mouse è il suo essere standard. Il suo inestimabile contributo è quello
di chi si è fatto carico di traghettare l’umanità verso
l’era digitale. Ma il suo mestiere probabilmente finisce laddove le interfacce
naturali cominceranno a funzionare davvero.
E qui è il caso di cominciare a mostravi qualche alternativa concreta.
L’espressione "natural interaction" gira in Rete da un pò, ma al mio
orecchio è giunto sopratutto attraverso una persona specifica: Alessandro Valli.
Il team di Firenze con cui Alessandro lavora, si è spesso confrontato con la
problematica delle interfacce pubbliche poste in luoghi particolari (ad esempio
i Musei), e con la necessità di avere una fruizione contemporanea e multipla
dell’informazione disponibile nel sistema.
Le formule applicate sono quelle legate al riconoscimento della posizione della
persona che intende interagire con il sistema, oppure dei suoi gesti. I fruitori
che si confrontano con queste interfacce NON hanno bisogno di alcun training,
perché è il sistema stesso ad offrirgli degli spunti e/o -mentre altri lo stanno
usando- a scatenare quei meccanismi di emulazione così adatti all’apprendimento.

Questi sistemi non soltanto "umanizzano" il tipo di interazione a cui le persone
devono ricorrere per fruire del contenuto informativo, ma umanizzano anche
i sistemi stessi, dotandoli talvolta di una apparenza e di comportamenti più
umani.
-
Alcuni
progetti di Alessandro Valli
NOTA: Se state pensando:"Ok, forse i PC non vanno bene in certi contesti pubblici,
ma potrebbero funzionare benissimo palmari ed altre tecnologie
portatili…" beh, allora leggetevi questo mio vecchio articolo: KILLER
WIRELESS MUSEUM. Se invece state pensando che solo taluni contesti non
siano adatti al PC tradizionale e che -comunque- non esistono alternative…
beh, date un occhio al resto di questo articolo.
Computer
comandati con lo sguardo
La prima cosa che fu necessaria insegnare alla gente
quando fu introdotto il mouse, fu il concetto di SELEZIONE dell’oggetto/voce
con il quale si intende operare. Questa selezione preventiva fu tradotta
in una tecnica di interazione chiamata POINT and
CLICK. Ovvero: la selezione di un oggetto/voce specifcico viene
effettuata portando il PUNTATORE sul comando/voce
es. evidenziandolo attraverso un singolo "semplice" CLICK (attraverso il tasto
presente sul mouse).
Ebbene, le interfacce naturali che mi mostrerò in questo paragrafo si basano sulla separazione del point and click, e sulla opportunità di evidenziare/preselezionare
un oggetto/voce della GUI semplicemente guardandola. In un istante successivo,
sarà possibile associare una qualche azione specifica, attraverso un CLICK
che avviene con diverse modalità, ad esempio: comando vocale, tasto speciale
esterno, tasto della convenzionale tastiera, etc.
Se vi sembra una cosa difficile, vi posso assicurare che è meno difficile che
imparare a coordinare occhio e mano per muovere il puntatore sullo schermo.
Infatti, qualunque punto dell’interfaccia grafica voi vogliate raggiungere
con il mouse, dovete prima guardarlo. Beh, con queste nuove interfacce guardarlo
è uguale a raggiungerlo e preselezionarlo. Dovete solo sceglire se "cliccare"
o meno.
Come oramai sappiamo dai "tre pilastri dell’interfaccia", il fatto di cambiare
input-device influenza ogni aspetto dell’interfaccia. Ad esempio, in tutti
i prototipi e sistemi da noi realizzati con la modalità eye-controlled, non
esiste il puntatore. Niente freccine e altre ulteriori mediazioni grafiche.
Ciò che guardi reagisce!

IMMAGINE IN ALTO - A sinistra:
l’uso congiunto di un tasto della tastiera e dello sguardo ricompone il POINT
and CLICK classico. Al centro: Il sistema monitorizza glli
occhi (se sono nel suo campo visivo) e determina COSA la persona guarda nello
schermo, fornendo un immediato feedback/preselezione di ogni item puntato. A
destra: …sto testando il sistema tenendo le mani rigorosamente
sotto al mento!
QUI SOTTO:
Una prima interfaccia sperimentale per la gestione di una intera casa. Progetto
realizzato per conto del Fraunhofer Institute e mirato a persone normodotate
o con disabilità motorie minori. Progetti successivi (indipendenti)
ci hanno consentito di prototipare sistemi altamente utilizzabili da persone
con gravi disabilità motorie. Per
informazioni scrivetemi.

Al momento, queste interfacce si basano su un hardware piuttosto costoso:
un Eye-Tracker Tobii. Questo NON consente la immediata scalabilità della
soluzione su un mercato consumer, ma io penso sia estremamente importante
sia per mercati verticali e utenti "speciali" che -più in generale- per
dare una consistente spinta verso la ricerca/creazione di paradigmi di
interazione più natuali.
CONCLUSIONI: Ma chi ha
bisogno di un nuovo computer?
Il continuo cambiamento delle tecnologie informatiche è costretto in un gioco
di forze opposte.
Da un lato, i produttori di HW/SW che DEVONO vendere continuamente
qualcosa di nuovo, ma che NON POSSONO rischiare cambiando più di tanto quello
che già ha avuto successo commerciale e diffusione. In questo mondo, il marketing
(o almeno quello di serie B) sceglie prima le deadline e poi il contenuto. …
il debuggin ed il supporto lo faranno direttamente i clienti.
Dall’altra parte ci sono le persone.
Taluni già ampiamente disillusi
dall’inseguire continuamente le "innovazioni". Altri ancora ampiamente
sedotti.
Così, ci ritroviamo in un mondo nel quale si può avere la fibra
ottica in casa, e - per scrivere una lettera- si usa l’onnipresente WORD 11 (che
-per la vergona- è stato ribattezzato WORD 2004). Il quale è
-praticamente- il risultato del peggioramento continuo del WORD 4. Ciliegina
finale: scriviamo le nostre lettere con una tastiera QWERTY, inventata per evitare
che -scrivendo troppo velocemente- si accavallassero i bastoncini di legno delle
antenate delle macchine da scrivere.
Se questo è il progresso dell’informatica, lasciatemi dire che qualcuno ha imboccato
un vicolo cieco.
Dal mio punto di vista, oggi abbiamo la potenza di calcolo e le tecnologie
abilitanti per ricominciare a pensare al futuro del computer. Perché no, proprio
ripartendo dai video-scenari e dagli assistenti digitali pensati quasi vent’anni
or sono dai geni della Apple Computer.
…certo, sino a qualche tempo fa, forse qualcuno avrebbe potuto convincermi
che "la tecnologia non era ancora pronta", ma non è così.
Vi ho mostrato già
degli esempi concreti, e posso aggiungere dell’altro. Un gruppo di otto ragazzi
che lavora con me alla SR LABS di Milano, con un normale computer desktop comprato
alla CDC, ha integrazione un Eye-Tracker TOBII ed un sistema
di ricoscimento vocale acquistabile ovunque.
Oggi, quel computer, risponde ai
comandi vocali (con un vocabolario definito a priori) e associa questi comandi
alla SELEZIONE VISIVA che la persona che gli sta dinanzi sta facendo. Il
nostro sistema sa se qualcuno gli sta dinanzi, ed agisce
in conseguenza ad azioni indicate con gli occhi e
la voce (ad es. è
in grado di eseguire un copia/incolla detto a voce, dove il COSA copiare ed il
DOVE incollarlo è indicato con lo sguardo).
Se un gruppetto di otto persone (di cui soltanto due ingegneri) sono riusciti
a mettere insieme tutto ciò, cosa potrebbero fare le mitiche startup californiane
o i 3000 ricercatori di Microsoft se soltanto lavorassero in una direzione opportuna?
Qual’è la direzione? Ovviamente quella delle tecnologie antropocentriche
e delle interfacce naturali. La IT with Human Face il cui ispiratore è il
precocemente scomparso Michael Dertouzos (alcuni
articoli raccolti da Business 2.0), già capo del MIT ed autore del
libro
"The
Unfinished Revolution".
So che nel dirlo salto una serie di passaggi logici e non pretendo di essere
chiaro, ma comincio a pensare che il computer definitivo NON sarà un
computer!
Consetitemi una ultima nota: Tutte le interfacce e gli scenari che vi
ho mostrato sono rigorosamente MADE IN ITALY. Qualcuno in alto si svegli! Perché
i treni dell’innovazione continuano a passare.
No responses yet


Leandro Agrò - 10+ anni di Design & Management
(short