5.2  La localisation relative

L’idée sous-jacente

C’est grâce à la mémoire sensorielle associée à notre perception kinesthésique, que nous pouvons nous représenter mentalement la position des objets que nous sommes en train de manipuler. Nous allons associer cette approche à une utilisation de périphériques de pointage à retour de force et à un retour audio (synthèse vocale et son). C’est ce que nous nommerons par la suite la localisation relative .

Par exemple, sur la figure 5.1, un utilisateur non-voyant pourra reconnaître les positions relatives de départements français de la région Midi-Pyrénées (l’exemple en haut de la figure) ou bien la disposition des membres d’un être virtuel (l’exemple du bas de la figure).

Figure 5.1 : La localisation relative

Afin d’illustrer ce concept d’interaction, nous proposons la métaphore du levier de vitesse (figure 5.2), qui comprend nombre de similitudes avec la localisation relative :

  • l’action de l’utilisateur est le déplacement d’un point dans l’espace ;
  • le feedback de l’action est constitué par un retour haptique (guidage et cran) et sonore (bruit du moteur) ;
  • l’interaction est réalisée sans regarder le levier (ou alors, il faut penser à apprendre à conduire) ;
  • une phase d’apprentissage est nécessaire, ainsi qu’une mise à niveau quant aux spécificités des différents modèles. Par exemple, la marche arrière est en haut à gauche, ou encore, la boite compte 6 vitesses.

Figure 5.2 : La métaphore du levier de vitesse

Mise en œuvre technique

Cahier des charges

Le système devra respecter au mieux les points suivants :

  • Se baser sur des formats de fichier les plus pérennes possible
  • Être extensible pour s’adapter à d’autres domaines
  • Permettre une traduction haptique la plus automatique possible

Le format de fichier

Nous avons décidé de baser notre système sur le formalisme XML. Nous avançons plusieurs raisons à ce choix :

  1. Le format XML est un format ouvert et normalisé.
  2. Il existe toute une panoplie d’outils pour la manipulation des fichiers XML : XSL, XPath...
  3. Certains formats issus du XML peuvent être utilisé dans un contexte Web : SVG, MathML, X3D...
  4. Certains domaines disposent de leur formalisme XML : CML pour la chimie, SVG pour les graphismes vectoriels, MathML pour les mathématiques...
  5. Quasiment tous les langages de programmation disposent d’outils permettant la lecture, la manipulation ou la création de fichiers XML. Pour notre part, nous avons utilisé Perl et PHP côté serveur. Côté client, c’était du javascript qui pouvait générer le SVG, javascript parfois lui-même généré par une programmation server-side .
  6. Le XML est scriptable . En d’autres mots, il permet une interaction avec l’utilisateur, et ce, de manière relativement facile; de plus, grâce au DOM (Document Objet Manager), il est possible d’agir sur la structure même du document XML, par exemple en ajoutant dynamiquement un objet.

En pratique, c’est le format de fichiers SVG (Scalable Vector Graphics) que nous utilisons. Il s’agit du formalisme XML pour produire des images vectorielles. Mais pourquoi un format qui code des images ? La question est à poser, surtout lorsque les applications basées sur notre approche, ciblent les utilisateurs non-voyants. En fait, le SVG va nous donner les informations spatiales dont nous avons besoin pour générer les effets de retour de force. Et ce, de manière beaucoup plus automatique qu’avec un fichier binaire codant une image bitmap (comme les fichiers jpeg ou gif).

Par exemple, considérons le code SVG suivant :

    <rect x="1" y="1" width="1198" height="398" fill="none" stroke="blue" stroke-width="2"/>

Il s’agit de la déclaration d’un rectangle dont le coin supérieur gauche est aux coordonnées (1,1), dont la largeur est 1198 et la hauteur 398. En connaissant ces données, il est simple de générer une force sur un périphérique adapté, de manière à amener le dispositif au centre de ce rectangle (en l’occurence, en x=599 et y=296).

Le retour de force

Notre retour de force est généré via la souris Wingman Force Feedback Mouse. De plus, nous utilisons le Web Plugin d’Immersion™pour disposer du retour de force dans un navigateur Internet. En l’occurence, il s’agit de Internet Explorer, car c’est un des seuls qui accepte le plugin.

L’effet que nous utilisons pour situer un point haptique est illustré sur la figure 5.3. Il s’agit d’un effet d’encloisonnement elliptique, déclenché lorsque le curseur passe au dessus de certaines zones. Le tout étant de placer judicieusement cet effet, rapport aux coordonnées que nous lisons dans le ficher SVG.

Figure 5.3 : Illustration de l’effet utilisé

Une approche manuelle

La première approche que nous avons utilisée pour placer l’effet en relation avec l’affichage, a été purement manuelle. Il s’agissait de créer un tableau contenant les coordonnées des points en question. Ces coordonnées, ont été préalablement relevées, dans un logiciel d’édition de fichiers SVG, à la main. Il fallait de plus, conserver un certain ordre afin de retrouver quelles coordonnées allaient avec quel point.

Des approches plus automatiques

L’emplacement de l’effet est calculé au chargement du SVG :

À la lecture du fichier SVG, il est possible de calculer un couple de coordonnées symbolisant le centre d’une forme. En reprenant notre exemple précédent, qui code le rectangle, une fonction javascript peut facilement calculer le centre de la primitive <rect>, en l’occurence, dans le système de coordonnées du SVG, xc=599, et yc=199. Nous avons ainsi développé plusieurs fonctions permettant le calcul du centre d’inertie, pour un rectangle, une ellipse.

Le problème s’est compliqué lorsque nous nous sommes penché sur les primitives <polygon> et <path>. La primitive <polygon> code une suite de point de la forme "x1,y1  x2,y2 ...  xn,yn" afin de dessiner un polygone. La primitive <path> dessine un chemin, en donnant par exemple le point de départ, puis une liste de vecteurs. Le calcul en soi du centre d’inertie ne pose pas de problème. Par contre, il est également possible de tomber sur un centre d’inertie extérieur à la forme.

exemple avec la primitive <polygon>

    <polygon 
      points="10,10 10,100 100,100 100,90 20,90 20,50 70,10"
      style="fill: red; stroke : black"/>

La figure 5.4 illustre cette forme, ainsi que le centre d’inertie calculé : xc=47,14 et yc=137,14.

Figure 5.4 : Centre d’inertie extérieur à la forme

Pour cette raison, et pour éviter d’avoir à se lancer dans de fastidieux calculs qui visent à déterminer le centre géodésique de la forme, nous avons finalement opté pour une autre approche.

Utilisation de l’attribut translate :

L’approche que nous avons le plus utilisée, est toujours automatique. Néanmoins, elle présuppose un travail préalable lors de la création du fichier SVG; dans notre cas, le travail se fera lors de la génération du fichier.

L’approche consiste en :

  1. la création de formes vectorielles, centrée en (0,0),
  2. l’utilisation de ces formes en les plaçant dans un fichier SVG. Le placement de ces formes sera réalisé par l’attribut translate

dans l’exemple précédent :

Nous allons centrer la forme en (0,0); cette origine sera le point de retour haptique. Le code suivant

    <polygon points="-20,-20 -20,70 70,70 70,60 -10,60 -10,20 40,-20"
      style="fill: red; stroke : black"/>

nous donne la figure 5.5 :

Figure 5.5 : Forme centrée sur l’origine

Par la suite, il nous suffira de réutiliser cette forme, en la plaçant grâce à une translate avec la balise adéquate. Par exemple, pour placer notre forme en (50,150), on aura :

Finalement, nous n’avons plus qu’à lire la valeur de la translation pour positionner correctement l’effet. Le gros avantage de cette approche est également sémantique : nous manipulons ici un élément graphique, dont l’origine se trouve être un élément haptique. Notre forme devient un intéracteur bimodal : visuel et haptique.

Le retour audio

Dans nos prototypes, le retour audio n’est effectué que d’une seule façon, par sons pré-enregistrés (format wav ou mp3) inclus dans le fichier SVG lors de la génération. Pour autant, d’autres possibilités sont envisageables, telles qu’utiliser un lecteur d’écran et une synthèse vocale, de manière à faire prononcer des mots-clés inclus dans le fichier SVG. Autre approche, de même que nous générons dynamiquement le SVG, il est également possible de synthétiser le retour audio côté serveur, en créant un fichier midi, par exemple.

Enfin, quel que soit la façon dont nous disposons de la modalité audio, cette dernière se déclenche lorsque le pointeur de la souris passe au dessus d’une forme donnée, en même temps que le déclenchement de l’effet haptique.

Une architecture client-serveur basée sur MVC

Nous avons choisi un contexte d’application orienté Web-Application. Nos prototypes sont donc basés sur une architecture client-serveur.

Côté serveur, c’est le serveur Web Apache qui est utilisé. Côté client, nous utilisons le navigateur Microsoft Internet Explorer : en effet, Il est actuellement le seul à disposer du support de l’Immersion Web Plugin pour diriger la souris à retour de force.

Figure 5.6 : Architecture du système

Et d’un point de vue logiciel, nous nous sommes appuyé sur l’architecture Modèle-Vue-Contrôleur (MVC). Il s’agit d’un motif de conception pour le développement d’applications logicielles, qui sépare le modèle de données, l’interface utilisateur et la logique de contrôle. Ce motif a été mis au point par (Reenskaug, 1979), qui travaillait alors sur Smalltalk dans les laboratoires de recherche Xerox PARC.

Ce modèle d’architecture impose la séparation entre les données, les traitements et la présentation, ce qui donne trois parties fondamentales dans l’application finale : le modèle, la vue et le contrôleur :

  • Le Modèle représente le comportement de l’application : traitements des données, interactions avec la base de données, etc. Il décrit les données manipulées par l’application et définit les méthodes d’accès.
  • La Vue correspond à l’interface avec laquelle l’utilisateur interagit. Elle représente donc l’interaction côte entrée. Les résultats renvoyés par le modèle sont dénués de toute présentation mais sont présentés par les vues. Plusieurs vues peuvent afficher les informations d’un même modèle. Ce sera notre cas, puisque les données que nous afficherons seront diffusées via plusieurs media : l’écran, la souris à retour de force et les haut-parleurs.
  • Le Contrôleur prend en charge la gestion des événements de synchronisation pour mettre à jour la vue ou le modèle.

Par extension, et dans un cadre d’utilisation enseignant-élève, nous aurions un système avec un côté enseignant

Figure 5.7 : Le modèle MVC Enseignant-Élève

D’un point de vue technique, le XMLHttpRequest est une fonction javascript invoquée par le contrôleur vers le modèle. L’avantage de cette fonction est qu’elle dispose d’un mode asynchrone, et donc, l’interaction peut continuer côté client, sans attendre la réponse du serveur. C’est ce qui est nommé AJAX pour Asynchronous Javascript And XML (on pourra se référer à  l’appendice pour plus de détails).

Les réponses du serveur, enfin, permettent l’extensibilité et la flexibilité de l’application. En effet, deux formes de réponses peuvent survenir :

  • la réponse est sous une forme XML : dans ce cas, le contrôleur parse le XML, et en extrait les données nécessaires à l’interaction via la Vue.
  • la réponse est sous forme de texte : dans ce cas, le texte peut contenir des commandes pour le contrôleur sur chaque client, commandes pouvant étendre les possibilités du Contrôleur. Par exemple, dans un cadre typiquement enseignant-élève, le contrôleur de chaque poste doit se tenir à jour informé des traitements effectués par le modèle. Une réponse sous forme de texte peut contenir un nouvelle version de la fonction de mise à jour, pour ralentir ces dernières (gestion de la bande passante par le serveur par exemple, si le trafic devient trop important).

En résumé

Nous avons présenté notre approche technique. Il faut souligner que le meilleur reste à venir. En effet, pour le moment, le développement reste tributaire du bon vouloir des entreprises : le web plugin d’Immersion Corporation n’est plus développé depuis plusieurs années. Ainsi, il n’est pas possible de l’utiliser sous les navigateurs basé sur Gecko comme mozilla ou firefox. Or, ces navigateurs nous auraient permis d’améliorer la souplesse lors de la programmation, avec par exemple la possibilité d’inclure directement dans le code XML (XHTML en l’occurence) d’une page internet, une partie de SVG, sans avoir besoin de plugin externe pour l’affichage.

Au final, d’ici 2 à 3 ans, les choix techniques discutés ici pourront paraître assez lourds, mais les recommandations conceptuelles resteront valides.

Effet de la nature de la modalité audio sur la mémoire

Nous avons conçu une expérimentation, qui vise d’une part à valider notre approche, mais aussi à démontrer ses limites.

Nous allons chercher à montrer que la nature du retour audio influe sur le temps mis pour explorer une carte haptique, et donc sur la mémorisation de cette dernière. Par nature du retour audio, nous comprenons le type de son : un son contenant un sens écrit , et un son musical. Pour une personne non musicienne, par exemple, il est plus compliqué de mémoriser des notes de musique, que des chiffres, des lettres ou même des phrases.

Sujets

Nous avons pu faire passer notre test à 19 personnes (5 femmes, 14 hommes), âgés de 25 à 34 ans. Tous avaient déjà utilisé une souris. Enfin, quatre d’entre eux avait déjà manipulé la souris à retour de force.

Matériel

Le test a été effectué à l’aide de la souris Wingman Force Feedback Mouse. Pour le reste, une architecture client-serveur était en place, à savoir un serveur Apache, avec PHP activé, et un client avec Microsoft Internet Explorer pour lire les données envoyées par le serveur. Dans notre cas, le serveur et le client tournaient sur la même machine, un portable équipé de 512 Mo de mémoire, et d’un processeur Pentium 4 à 2 Ghz. Enfin le retour sonore se faisait via un casque audio.

Procédure

La tâche que nous avons mise au point est la plus générique possible. Il s’agit de compter des points haptiques à l’aide de la souris Wingman et sans retour visuel. Un point haptique est un effet d’attirance en un certain endroit de l’espace de travail de la souris.

L’espace de travail de la souris est ainsi divisé en un certain nombre de régions. Chaque région est donc pourvue d’un retour de force (un point haptique), et d’un retour sonore. Nous avons utilisé différents retours sonores, à savoir, des notes de musique, des lettres de l’alphabet pré-enregistrées, et le silence.

Les différents paramètres de l’expérience sont précisés dans le tableau 5.1.

Conditions audios : Notes, Lettres, ou Silence
Nombre de régions à trouver : 3, 6 ou 9

Table 5.1 : Les conditions expérimentales

La répartition des points haptiques sur la surface de travail de la souris est générée par une programmation côté serveur, de manière à construire des fichiers SVG, eux-mêmes interprétés, par une programmation javascript côté client, afin de générer le retour de force. Enfin, les positions de ces points haptiques sont choisies lors de la génération, parmi 18 positions pré-établies. À noter, enfin, que l’espace non-occupé par les formes SVG, génère une vibration avec la souris, indiquant au sujet qu’il est sorti de la zone d’intérêt. La figure 5.8 montre quelques configurations que les sujets ont dû explorer.

Figure 5.8 : Exemples des configurations à explorer ; les hexagones colorés représentent les zones haptiques à trouver et et à localiser

Une session consiste en une phase d’exploration avec 3, 6 ou 9 points haptiques, et une des conditions audios. Les sessions sont chronométrées. Et à la fin de chaque session, deux questions sont posées au sujet :

  1. Combien y-a-t-il de points haptiques ?
  2. Comment sont-ils agencés les uns par rapport aux autres ? (question ouverte : nous n’avons pas utilisé de formulaire de réponse, mais nous avons consigné les réponses orales, écrites ou gestuelles)

L’ordre des différentes sessions selon le nombre de points, et le type de retour audio, est aléatoire. Ceci afin de limiter les effets de l’apprentissage d’une session à l’autre, par rapport à la difficulté de la tâche (c’est à dire le nombre de points à trouver).

Avant de commencer, un exemple de chaque condition sonore est proposé, afin d’habituer les sujets au maniement de la souris, et au déroulement du test.

Pour terminer, nous avons noté les remarques que les sujets pouvaient nous faire.

Résultats et Discussion

Le temps nécessaire pour compléter la tâche : la mémorisation

La première donnée mesurable que nous pouvons commenter est le temps mis pour achever la tâche, en fonction du nombre de points et de la nature du retour audio. Le tableau 5.2 nous indique ces résultats, que la figure 5.9 illustre.

  Notes Lettres Silence Moyenne
3 points 55,8 48,9 56 53,6
6 points 117,6 87,6 144,4 116,5
9 points 162 117,4 183,1 154,2
Moyenne 111,8 84,7 127,8 108,1

Table 5.2 : Moyennes des temps (en ms), selon les conditions audios (axe horizontal) et le nombre de points (axe vertical)

Figure 5.9 : Les temps selon les différentes conditions audios

Nous remarquons immédiatement que les performances sont nettement meilleures avec les lettres. En moyenne, la tâche avec les notes de musique est 31,8% plus lente qu’avec les lettres ; et la tâche sans retour audio est 50,8% plus lente.

À présent, la figure 5.10 présente ces mêmes résultats, en les groupant selon le nombre de points présentés.

Figure 5.10 : Les moyennes des temps, selon les différentes conditions audios, et en fonction du nombre de points à trouver

Les temps évoluent clairement en augmentant avec le nombre de points, et ce d’une manière pratiquement linéaire. De plus, on retrouve un comportement très similaire dans les trois cas : la reconnaissance est plus rapide quand ce sont des lettres qui sont présentées, puis viennent les notes de musique, et le silence.

Petite remarque, néanmoins : lorsqu’il n’y a que trois points, les différences de performances sont relativement faibles (de l’ordre de 15%). On peut expliquer ceci par le fait que trois éléments à mémoriser reste de toute façon une tâche facile, même si on remarque déjà des différences de performance.

La mémorisation de l’agencement spatial

Grâce aux questions posées après chaque essai, nous avons pu noter sur 10, la qualité de l’agencement reconnu des points.

La note est calculée de la manière suivante :

  1. la première réponse concerne le nombre de points reconnus. Sur cette partie, on notera Nc le nombre reconnu de points, et Nr le nombre réel de points. L’ensemble de la note devra tenir compte du nombre d’éléments à retrouver Nr : en effet, il serait étrange de sanctionner d’avantage 7 points trouvés sur 9 , que 2 points trouvés sur 3 .
  2. la seconde réponse concerne l’agencement des points. La note est ici plus difficile à formaliser afin d’éviter une certaine subjectivité : nous devons compter avec la disposition générale des réponses données (il y a un élément en haut, et un autre à droite ), ainsi qu’avec une certaine exigence de précision (l’élément du haut est deux fois plus éloigné du centre que celui de droite ). Nous notons cette partie de la note Ag, entre 0 et 10.

Nous allons chercher à obtenir une note N, sur 10, dans tous les cas de figure (3, 6, et 9 points). Le comportement de la notation doit suivre la qualité de la réponse.

La note N sera alors calculée selon la formule :

\[ N=A_{g}\left(\frac{N_{c}}{N_{r}}\right)\]

Ce comportement de la notation nous semble conforme à la qualité des réponses.

Au final, le tableau 5.3 présente la synthèse de ces notes, et la figure 5.11 illustre le comportement des notes, selon la nature du retour audio.

  Notes Lettres Silence Moyenne
3 points 9,48 9,75 9,18 9,48
6 points 7,28 8,03 6,33 7,21
9 points 5,33 6,82 4,98 5,71
Moyenne 7,39 8,20 6,83 7,46

Table 5.3 : Moyennes des notations, sur 10, selon les différentes conditions audios, et en fonction du nombre de points à trouver

Figure 5.11 : Notations selon les différentes conditions audios

D’une manière similaire à ce que l’on a observé avec les temps, au paragraphe précédent, nous notons que le retour Lettres obtient les meilleures notes. Le retour audio notes obtient des notes 9,5% plus faibles que le retour lettre ; quant au retour silence , ses notes sont 16,7% plus faibles.

Nous notons également que les notes s’effondrent très rapidement avec l’augmentation du nombre de points à découvrir. Cela peut provenir de notre méthode de notation, mais nous pensons qu’il s’agit de la difficulté intrinsèque de la tâche : une reconnaissance, et une localisation à l’aide d’une souris à retour de force, reste une tâche ardue, du fait notamment du manque de précision du périphérique, et du retour haptique sur un unique point de contact.

Maintenant, la figure 5.12 distingue les notes selon le nombre de points à découvrir.

Figure 5.12 : Notations, selon les différentes conditions audios, et en fonction du nombre de points à trouver

Là encore, les résultats sont très proches de ceux déjà observés, et ce, dans les trois cas de figure : les meilleurs résultats pour le retour lettres , suivi du retour notes , et le retour silence .

Il s’agit maintenant de commenter tous ces résultats, ensembles. À savoir, existe-t-il un lien entre les performances lors de la tâche, et la note obtenue ?

Corrélation entre le temps de la tâche et la notation ?

Pour terminer, nous synthétisons tous ces résultats sur la figure 5.13.

Figure 5.13 : Corrélation entre le temps mis lors de la tâche, et la notation. Les grands symboles représentent les positions moyennes pour chacune des conditions de retour audio

En conclusion

Cette série de tests nous permet de poser quelques réflexions sur notre approche. Cela montre déjà la faisabilité de l’approche : la mémorisation s’opère bien, et les erreurs quant-à la précision spatiale tend à diminuer avec l’habitude du dispositif.

Les retours utilisateurs désignent cependant les limites du périphérique. Bien que l’approche plaise lors de l’explication pré-expérimentation, il s’ensuit une certaine frustration : les effets ne sont pas assez forts . Ceci est malheureusement le fait des caractéristiques techniques de la souris, plafonnant à 1N.

Nous pensons que cela peut néanmoins valider notre approche, tout du moins dans un cadre d’expérimentation et de prospection.

Par la suite, un test impliquant plus de monde pourrait permettre d’affiner les résultats. Il pourrait être intéressant, par exemple, de prendre en compte l’effet de l’âge sur les résultats. Les données que nous avons recueillies ne sont pas suffisamment nombreuses pour pouvoir conclure sur ce point, mais il semble que les sujets jeunes appréhendent plus facilement, et rapidement, le maniement de la souris.

Modélisation du temps d’exploration

Nous allons maintenant tenter de modéliser le temps qu’il nous faut pour explorer une surface haptique, telle que nous la considérons depuis le début de ce chapitre. L’idée est de déterminer comment le temps d’exploration évolue, en fonction du nombre d’éléments présentés. Enfin, l’expérience précédente semble avoir montré une évolution du temps d’exploration linéaire, selon le nombre d’éléments à sentir.

Nous allons donc proposer une tâche de recherche d’éléments, parmi un ensemble de points haptiques.

Nous posons l’hypothèse que le temps T de la tâche peut se décomposer de la manière suivante :

\begin{equation} T=ET+RT+MT\label{eq:temps}\end{equation}

avec, T, le temps total de la tâche,

ET, le temps d’exploration

RT, le temps de réaction

et MT, le temps du mouvement.

Ce dernier sera modélisé selon la loi de Fitts. Le temps de réaction RT sera modélisé selon la loi de Hick-Hyman, que nous présentons maintenant.

La loi de Hick-Hyman

Hick et Hyman (Hyman, 1953) on étudié la relation entre le temps de réaction RT et le nombre de réponses-stimuli alternatifs n. Leurs résultats montrent que le choix RT semble augmenter régulièrement d’environ 150 ms lorsque le nombre de réponses-stimuli n double. Ceci suggère une relation logarithmique entre le nombre de stimuli-réponses et le temps de réaction. L’interprétation de cette relation montre que le logarithme du nombre d’alternatives est une mesure de la quantité d’information à traiter. Plus il y a d’alternatives, plus il y a d’informations à traiter.

La loi de Hick-Hyman s’exprime ainsi :

le temps de réaction pour faire un choix parmi n alternatives est :

\begin{equation} RT=a+b\log_{2}(n)\label{eq:hick}\end{equation}

a et b sont des constantes déterminées empiriquement.

b est la pente ou le taux de traitement d’information et s’exprime en s/bit. Généralement, b=127−215 ms/bit d’information.

a est l’ordonnée à l’origine et est exprimé en seconde. On estime a=179 ms lorsque log2n=0,  n=1. Ainsi, a est la vitesse élémentaire du système de perception moteur.

Les valeurs de a et b dépendent :

  • de l’entraînement;
  • de l’effet de compatibilité entre les stimuli et les réponses;
  • de la familiarité avec le sous-ensemble de stimuli;
  • du pouvoir de discrimination entre les stimuli;
  • et de l’effet de la répétition des stimuli.

Sujets

Onze sujets, âgés de 24 à 32 ans, ont participé au test. Tous avaient déjà participé au test précédent, et donc, avaient une certaine habitude avec la souris à retour de force.

Matériel

Le présent test reprend exactement le même matériel que le précédent. À savoir : une souris à retour de force Wingman Force Feedback Mouse, branchée sur notre architecture client-serveur; des script php générant les médias.

Procédure

La tâche demandée aux sujets est la suivante :

Un certain nombre de points haptiques vont vous être présentés à l’aide de la souris à retour de force. À chaque point est associé un retour audio; ici, ce sera un nombre qui sera lu. Vous devez explorer la surface, puis aller cliquer le plus vite possible sur la zone dont le retour audio correspond au nombre le plus faible.

Visuellement, la tâche peut être représentée comme indiqué sur la figure 5.14. Cependant, lors de ce test, l’écran n’était pas allumé.

Figure 5.14 : Illustration de la procédure, pour 4 points

Synthétiquement, les conditions expérimentales se trouvent dans le tableau 5.4. Ainsi, à chaque session de l’expérience, le nombre de points haptiques augmente. On commence avec 2 points ; puis 3, 4, 6, et enfin 9 points. Chaque session comporte 10 essais, où les valeurs des nombres lus, et leurs positions, sont tirés aléatoirement. Enfin, ces nombres sont lus par une synthèse vocale; leurs valeurs varient entre 1000 et 3000. Les sujets ne sont pas au courant de ces bornes.

Nombre de zones 2, 3, 4, 6 et 9
Valeurs des nombres [1000;3000]
nombre d’essais par session 10

Table 5.4 : Paramètres de l’expérience

Calcul du temps théorique moyen des mouvements

Afin de déduire le temps d’exploration ET, nous allons soustraire au temps total le temps de réaction RT, que nous obtenons grâce à la loi de Hick-Hyman, ainsi que le temps du mouvements MT.

Comme dans chaque situation, la position de la cible à atteindre est aléatoire, nous allons estimer la moyenne des mouvements possibles, en fonction du nombre de zones.

Détaillons le calcul pour 4 zones. La situation est schématisée sur la figure 5.15

Figure 5.15 : Les mouvements possibles pour 4 zones à explorer

Nous dénombrons :

  • 4 mouvements nuls
  • 6 mouvements d’une longueur A/2
  • 4 mouvements d’une longueur 3A/2
  • et 2 mouvements d’une longueur 5A

Soit, respectivement, et d’après la loi de Fitts, des temps de mouvements équivalents à:

  • \(4a\) ms
  • \(6\left[a+\log_{2}\left(\frac{A}{2W}+1\right)\right]\) ms
  • \(4\left[a+\log_{2}\left(\frac{3A}{2W}+1\right)\right]\) ms
  • \(2\left[a+\log_{2}\left(\frac{5A}{2W}+1\right)\right]\) ms

Tous ces calculs sont théoriques. Pour obtenir une valeur numérique, nous allons utiliser les valeurs des coefficients que nous avons déterminés lors de l’expérience sur les performances d’une tâche de pointage sur un champ à retour de force (voir cha :=C9valuation-des-performances), à savoir 380 ms., et b=123 ms/bit (condition MTDF).

Il nous reste alors à déduire la moyenne des temps, en fonction du nombre de zones. Les résultats des calculs sont dans le tableaux 5.5.

n 2 3 4 6 9
\(MT_{moy}\) (en ms) 499 528 550 586 627

Table 5.5 : Temps théoriques des mouvements moyens, en fonction du nombre de zones

Calcul du temps de réaction théorique

En s’appuyant sur la loi de Hick-Hyman, nous pouvons écrire les temps théoriques minimum et maximum de réaction, avec les coefficient b=127 ms/bit., et b+=215 ms/bit.

  • minimum : \begin{equation} RT^{-}(n)=179+127\log_{2}(n)\label{eq:RT1}\end{equation}
  • et maximum : \begin{equation} RT^{+}(n)=179+215\log_{2}(n)\label{eq:RT2}\end{equation}

D’où l’évolution des temps théoriques minimum et maximum de réaction, en fonction du nombre de zones (tableau 5.6).

Nombre de zones 2 3 4 6 9
Temps de réaction minimum \(RT^{-}\) (ms) 306 380 433 507 581
Temps de réaction minimum \(RT^{+}\) (ms) 394 519 609 734 860

Table 5.6 : Temps de réaction minimum et maximum théoriques

Résultats et discussion

Les résultats de l’expérience sont présentés dans le tableau 5.7, et illustrés graphiquement sur la figure 5.16.

Nombre de zones 2 3 4 6 9
Temps moyen de la tâche (ms) 1291 2269 2636 4869 5644

Table 5.7 : Résultats de l’expérience

Figure 5.16 : Évolution du temps de la tâche en fonction du nombre de zones

En partant de notre hypothèse de base, c’est à dire Temps=ET+RT+MT, nous pouvons déduire les valeurs minimum et maximum des temps d’exporation \(ET^{-}\) et \(ET^{+}\), en soustrayant aux temps de la tâche, les temps théoriques de réaction (\(ET^{-}\)et \(ET^{+}\) calculé avec les équations 3 et 4), ainsi que les temps théoriques moyens des mouvements \(MT^{moy}\). Ce calcul est synthétisé dans le tableau 5.8.

Nombre de points Temps (empiriques) \(RT^{-}\) (théoriques) \(RT^{+}\) (théoriques) \(MT^{moy}\) (théoriques) \(ET^{-}\) (déduits) \(ET^{+}\) (déduits)
2 1291 306 394 499 486 398
3 2269 380 519 528 1361 1222
4 2636 433 609 550 1652 1476
6 4869 507 734 586 3776 3548
9 5644 581 860 627 4435 4156

Table 5.8 : Résultats : les temps moyens de la tâche T, les temps théoriques MT, et RT, d’où par soustraction les temps d’exploration minimum et maximum (\(ET^{-}\)et (\(ET^{+}\).

Traçons maintenant, la somme des temps de mouvement et d’exploration : on a soustrait des temps totaux, le temps de réaction théorique. On peut d’ores et déjà noter, sur la figure 5.17, que dans ce cas, le temps tombe à 0 quand le nombre de zones est nul. Ceci tend à confirmer notre hypothèse de départ. En effet, une fois ôté le temps de réaction, le temps devrait se trouver nul, car il n’y a plus, ni exploration, et donc ni mouvement. À noter qu’avec une cible unique, le temps MT+ET est non nul. Cela provient du temps de déclenchement du geste (le terme a dans la loi de Fitts).

Figure 5.17 : Temps d’exploration et de mouvement, en fonction du nombre de zones

Soustrayons à présent le temps de mouvement MT, et traçons le résultat sur la figure 5.18. Nous pouvons y observer que le temps d’exploration ET, tombe à 0 lorsqu’il n’y a qu’une seule zone haptique. Ceci tend également à confirmer notre hypothèse. En effet, on peut imaginer qu’avec une seule zone, il n’y a intuitivement pas de phase d’exploration.

Figure 5.18 : Temps d’exploration en fonction du nombre de zones

Conclusion

D’après notre expérimentation, le temps d’exploration d’une surface, à la recherche d’une zone haptique, semble être linéaire en n. Cependant, notons bien que dans notre test, nous n’avons pas étudié les cas au delà de 9 points haptiques. En effet, le modèle du processeur humain nous donne une mémorisation à court terme de 7±2 éléments, selon la concentration ou la fatigue. Aussi, nous essaierons d’éviter de présenter trop de zones haptiques en même temps, dans une tâche de mémorisation.

Vers les applications de la localisation relative

Les tests que nous avons effectués dans cette section, valident selon nous notre approche, en terme de mémorisation sensorielle, ainsi qu’en terme d’utilisation du dispositif. Passé la surprise lors des premiers maniements de la souris à retour de force, les sujets de nos tests ont tous relevé l’intérêt d’un tel dispositif, tout en regrettant parfois la surface de travail trop petite.

Nous allons maintenant poursuivre dans ce chapitre en présentant les deux prototypes basés sur la localisation relative, que nous avons développés. Le premier prototype concerne la géographie, et le second, l’harmonie musicale.