Auto-stéréoscopie: un futur sans lunettes

La stéréoscopie désigne l'ensemble des techniques permettant de reproduire des images en relief. Les systèmes stéréoscopiques consistent à isoler une image différente pour chaque œil de l'observateur afin de satisfaire sa vision binoculaire, responsable de l'appréhension du relief.

Il existe actuellement de nombreuses techniques dont la plupart nécessitent de porter des dispositifs optiques (lunettes, stéréoscopes). Mais il existe aussi des techniques qui permettent de reproduire le relief directement sur l'écran sans que l'observateur ait besoin de quoi que ce soit; c'est ce qu'on appelle l'auto-stéréoscopie.

Parmi ces techniques il y a :
  • l'auto-stéréoscopie à barrière parallaxe,
  • l'auto-stéréoscopie à réseau lenticulaire ou alioscopie,
  • l'auto-stéréoscopie multivue.

Même si chacune de ces techniques présente des inconvénients, elles ont toutes un intérêt dans la démocratisation de la stéréoscopie.

Auto-stéréoscopie à barrière parallaxe

Sharp, le constructeur japonais, est le premier à avoir proposé un ordinateur portable 3D au grand public, puis un écran LCD 15 pouces. Son premier avantage sur la stéréoscopie : passer de la 2D à la 3D en appuyant sur un bouton. L'écran n'est donc pas condamné à travailler en 3D.

Ce sont en fait de simples écrans à cristaux liquides classiques auxquels on a intercalé un cache entre la dalle LCD et le rétroéclairage. Ce cache est placé de telle sorte qu’un observateur, placé à une certaine distance de l’écran, ne percevra avec chaque œil qu’une colonne d’affichage sur deux. Il suffit alors de découper les images destinées à chaque œil en colonnes d’un pixel de large et de les afficher en intercalant les colonnes de chacune des images. Chaque œil ne percevant qu’une colonne sur deux, verra donc une seule des deux images.

Chaque œil récupère donc une image qui lui est propre, que le cerveau additionne en recréant l'impression de relief.

barriere_parallaxe

Le gros inconvénient de cette technique est sa rigidité : l'observateur doit se placer en face de l'écran, à distance suffisante et éviter de bouger pour garder l'illusion de 3D. L'autre point gênant vient du fait que nous n'utilisons qu'un pixel sur deux pour chaque vue, ce qui a pour effet de réduire la définition latérale de l'image.

Le "head tracking" est une des solutions existantes pour ajuster l'angle de diffusion des images et la vue de scène en fonction de la position de l'observateur. Ce système, bien que bluffant de réalisme, est relativement difficile à mettre en place et reste limité puisqu'il ne permet pas la visualisation de l'image à plusieurs observateurs simultanément.

Auto-stéréoscopie à réseau lenticulaire ou alioscopie

Cette technique s'inspire de l'imagerie lenticulaire.


lenticular_screen

Rappelons tout d'abord son fonctionnement. Comme on peut le voir sur ce schéma, les deux vues sont entrelacées sur une même image. On superpose alors un réseau lenticulaire constitué d'une multitude de lentilles "plan-convexes". Pour chaque couple "vue de gauche/ vue de droite" de l'entrelacement, une lentille viendra faire diverger les rayons issus de l'image séparant ainsi les deux vues pour l'œil de l'observateur comme on peut le voir sur ce schéma :

lens

Appliqué aux écrans, il suffit de faire l'entrelacement sur les pixels et d'ajouter un réseau lenticulaire sur l'écran. C'est Pierre Alliot qui, en 1987, a utilisé pour la première fois ce principe pour créer des écrans 3D, baptisés sous le nom d'alioscopie.

Tout comme l'imagerie lenticulaire, il est tout à fait possible de prendre un nombre plus important d'images entrelacées. On peut ainsi agencer une multitude de vues derrière chaque lentille pour offrir à l'observateur une plus large zone d'observation, ce qui lui permet d'observer une scène sous différents angles sans perdre le relief.

lenticular_screen_anim

Pour obtenir un rendu convenable, il est préférable de multiplier le nombre de vues. Dans la pratique, ces écrans fournissent généralement au moins 8 points de vue différents, ce qui représente une bonne alternative au "head tracking".

Cependant, la mise en œuvre d’un tel système, tout comme pour la barrière parallaxe, implique une perte de résolution pour chaque vue proportionnelle au nombre de vues affichées. De plus, il pose un problème de performance pour l'affichage d'images 3D en temps réel.

L'auto-stéréoscopie multivue

Ce procédé a été développé par l'université de Cambridge.
L'auto-stéréoscopie multivue consiste à projeter les différentes images, correspondant aux différentes vues possibles, dans des directions différentes, les unes après les autres.

Le dispositif le plus simple pour arriver à ce résultat consiste à éclairer un écran à cristaux liquides avec une lumière convergente. Ainsi, la zone de visualisation sera restreinte à une certaine zone de l'espace. En multipliant les sources de lumière, on peut alors envoyer plusieurs images dans plusieurs zones de l'espace :

multi_views

En projetant les différentes vues à tour de rôle, à une fréquence suffisamment élevée, on obtient une image observable sous différents angles. Le gros avantage de cette méthode sur l'alioscopie est la non-altération de la définition de l'image.

Cependant, le fait de devoir projeter les différentes vues, les unes à la suite des autres, pose un lourd problème de performance :

  • il faut que l'écran LCD ait un taux de rafraichissement très élevé (120 Hz),
  • il faut que le passage d'une vue à une autre se fasse en quelques millièmes de secondes, ce qui n'est pas toujours chose facile pour la 3D temps réel.

Problèmes de performance

Le fait de devoir proposer plusieurs points de vue à l'observateur, comme nous l'avons vu pour l'alioscopie et l'auto-stéréoscopie multivue, pose un lourd problème de performance, car il faut fournir, en temps réel, l'intégralité des vues possibles de la scène. Cela a pour conséquence d'augmenter le nombre de calculs et la quantité de données générées.

Lorsque l’on a des systèmes à plus de 100 vues et que l'on veut maintenir au moins 30 Hz en taux de rafraichissement, il faut pouvoir calculer 3000 vues par seconde !

Le fait de devoir conserver les informations de nos 100 vues pour une frame donnée, avec une simple résolution de 1024x768, prendrait près de 240 Mo soit plus de 7 Go d'informations pour une seconde. Or, le DisplayPort version 1.0, qui est la nouvelle norme en connectique pour moniteur numérique, ne permettrait d'atteindre que 1.35 Go par seconde.

Pour répondre à ces différents problèmes de performance, de nombreuses recherches sont en cours sur des algorithmes qui permettront d'optimiser le système. Il s'agit de compresser les données générées ou encore de regrouper les opérations de projection, de rastérisation et autres pour l'ensemble des vues considérées, pour factoriser les calculs lorsqu'il s'agit d'images 3D temps réels.

Conclusion

Même si de nombreux progrès ont été accomplis en termes d'auto-stéréoscopie, les contraintes techniques sont encore très présentes, essentiellement pour des raisons de performance.
Le fait de devoir générer une multitude de vues différentes pour que l'observateur ne soit pas obligé de rester fixe devant son écran est encore trop couteux pour autoriser la démocratisation de ce système.

Sur ce point, le "head tracking" en vue stéréoscopique, qui s'affranchit du problème de multivue, reste le procédé le plus réalisable bien qu'il ne permette pas à plusieurs observateurs de profiter du spectacle en même temps.

Références