CODE D’UTILISATION DES NOUVELLES TECHNOLOGIES EN MATIERE D’INTERPRETATION DE CONFERENCE

 

  

INTRODUCTION

  

Pour mener à bien son rôle de vecteur de la communication multilingue, l’interprète de conférence doit réaliser simultanément plusieurs tâches complexes:

 

·      écouter celui qui parle, observer les signaux non verbaux de son message, ainsi que les réactions qu’il suscite auprès des destinataires du message, et entre ces derniers;

·      analyser un message éphémère et vivant dans sa globalité (le dit et le non-dit);

·      interpréter le message dans une autre langue en respectant les caractéristiques de forme et de fond propres à une autre culture;

·      établir avec son auditoire un contact visuel-gestuel pour confirmer la réception du  message.

 

Dans ce contexte, la vue directe sur l’ensemble de l’événement dans lequel s’inscrivent les messages à interpréter est essentielle.

 

Les nouvelles technologies ouvrent des horizons que les interprètes de conférence accueillent en général favorablement. La société de l’information, par exemple, élargit le choix des sources que les interprètes peuvent consulter pour mieux préparer les réunions. Les améliorations techniques ou ergonomiques des pupitres et des cabines d’interprétation  constituent également des progrès appréciables.

 

D’autres développements récents, en matière de téléconférence, notamment, appellent une attitude plus nuancée. Le rapport coût/efficacité et la valeur ajoutée ou retranchée en matière de qualité de la communication multilingue doivent être correctement évalués en tenant compte des inconvénients (effet conjugué de plusieurs phénomènes: message tronqué d’une partie de son contenu non verbal, non perception des réactions verbales et non-verbales des autres participants vis-à-vis de l’orateur et entre eux, scintillement des écrans, impossibilité d’apprécier comment le message interprété est reçu, sentiment d’aliénation, absence de lumière du jour…).

 

En tant qu’instruments au service d’un objectif, en l’occurrence la communication multilingue,  il n’est pas souhaitable que les nouvelles technologies puissent se traduire par une détérioration de la qualité des prestations ou des conditions d’exercice de la profession d’interprète de conférence.

 

 

Pour toutes ces raisons,  les interprètes de conférence :

de l’AIIC (Association internationale des Interprètes de Conférence),

de l'ASTTI (Association suisse des traducteurs, terminologues et interprètes)

du BDÜ (Bundesverband der Dolmetscher und Übersetzer),

de la Cour de Justice européenne,

de l’OMD (Organisation mondiale des Douanes)

du Parlement européen,

du SCIC (Service Commun Interprétation-Conférences pour la Commission européenne, le Conseil des Ministres, le Comité Economique et Social, le Comité des Régions, la Banque européenne d’Investissements, les Agences spécialisées de l’Union européenne), ont adopté le présent


C O D E

 

 

1.   Lors de toute conférence multilingue ayant recours à l’utilisation de nouvelles technologies pour réaliser des vidéo-visio-téléconférences sur des réseaux câblés ou non, sur internet, etc.,  il faut consulter au préalable les interprètes quant à la faisabilité du projet et les associer dès le départ à la préparation de la réunion pour en établir avec eux les modalités. En tout état de cause, les conditions seront au moins conformes aux normes ISO 2603, ISO4043, CEI914.

 

 

2.   Pour les interprètes, une des règles fondamentales de la norme ISO 2603 est la vue directe sur la salle. Suivre un débat sur écran, aussi bonnes que soient les qualités de son et d’image, les prive du contexte global  non-verbal indispensable pour mener à bien leur tâche. Leur attitude critique à l’égard de la vidéoconférence s’explique par leur attachement à ce principe, ainsi que pour des raisons liées à des facteurs de santé et de qualité. Pour y déroger, il faudrait que:

 

·     tous les autres principes des normes précitées soient scrupuleusement respectés, notamment en ce qui concerne la qualité sonore (transmission fidèle de la bande de fréquences comprises entre 125 et 12500 Hz), ce qui exclurait toute forme de vidéoconférence basée sur les normes H320 qui limitent la bande passante à 7500Hz, que ce soit par ligne RNIS, réseaux LAN, Internet, etc.

 

·     les interprètes disposent d’images de haute définition, synchronisées avec le son, d’une qualité qui permette de bien distinguer l’expression faciale et la gestuelle des intervenants et des participants. 

 

Compte tenu des contraintes spécifiques à la vidéoconférence (perte d’information non verbale, fatigue visuelle induite par les écrans, absence de lumière du jour, efforts de concentration et stress accrus, etc.), la durée totale de la prestation journalière des interprètes sera  limitée à 2 heures par jour.

 

Par ailleurs, la tentation de détourner certaines technologies de leur but premier en imaginant, par exemple, de placer les interprètes devant des moniteurs/écrans pour interpréter à distance une réunion dont tous les participants se trouveraient réunis dans un même lieu (téléinterprétation), est inacceptable.

 

 

 

1.   Dans toute configuration de réunion multimédia, il faudra veiller à ce que les interprètes aient accès aux mêmes informations que les délégués, ce qui implique que lors de la construction de nouvelles salles de conférence ou lors de la modernisation de celles-ci, les cabines d’interprétation doivent être pourvues des connexions nécessaires.

 

Annexe technique: définitions et normes applicables (références et brève description)

 

Annexe technique

 

 

DEFINITIONS

 

Téléconférence: toute forme de communication entre deux ou plusieurs participants se trouvant à deux ou plusieurs lieux distincts et reposant sur la transmission d’un ou plusieurs signaux “audio” entre ces lieux.

 

Vidéoconférence ou visioconférence: téléconférence comportant un ou plusieurs signaux vidéo qui véhiculent les images de tous ou de certains participants.

 

Vidéoconférence multilingue: vidéoconférence en deux ou plusieurs langues avec interprétation (consécutive ou simultanée).

 

Téléinterprétation: interprétation d’une vidéoconférence multilingue par des interprètes qui n’ont de vue directe ni sur l’orateur ni sur leur auditoire.

 

 

NORMES APPLICABLES : références et brève description

 

 

1.  Normes ISO en matière d’équipements d’interprétation simultanée

Norme ISO/DIS 2603 (révision de la norme ISO 2603 pour les cabines d’interprétation simultanée fixes et norme ISO/DIS 4043 (révision de la norme ISO 4043) pour les cabines mobiles.

Ces normes décrivent l’ensemble des conditions matérielles auxquelles doivent répondre les salles de conférence (cabines d’interprétation et appareils). Elles prévoient notamment que l’interprète doit avoir une vue directe sur la salle ainsi que sur tout écran de projection éventuel. En ce qui concerne la qualité du son reçu dans les casques des interprètes, il y est expressément stipulé que la bande des fréquences comprises entre 125 et 12500 Hz  doit être fidèlement restituée.

 

2.  Normes en matière de numérisation et de compression des signaux audio et vidéo[FR2] 

La numérisation se fait par échantillonnage du signal (analogique) audio ou vidéo. Pour numériser, par exemple, une conversation téléphonique, le signal audio est échantillonné 8000 fois par seconde et chaque échantillon est codé sur 8 bits, ce qui donne un débit de 64000 bits par seconde ou 64 Kbps. La bande passante est toutefois limitée à 3,4 kHz. A titre de comparaison, le signal audio provenant d’un lecteur CD est couramment échantillonné 44100 fois par seconde, soit une bande passante de 0 à 20 kHz, et il est codé sur 16 bits, générant de la sorte un débit (bit rate) de environ 711 Kbps avant compression.

La norme ITU-R 601 (“Studio-Quality TV”) s’applique à la transmission numérique des images TV. Les trois composants du signal vidéo: R (rouge), B (bleu) et V (vert) sont d’abord convertis en un signal de luminance Y (= R + B +V) et deux signaux de différence des couleurs: R-Y et B-Y. Pour chaque image (ou “frame”) comprenant 486 lignes dans le système NTSC et 576 en PAL/SECAM, on prend 720 échantillons pour la luminance, mais seulement la moitié (360) pour les différences de couleurs, chaque échantillon étant codé sur 8 bits. Le débit (bit rate) résultant est d’environ 165 Mbps (1 Mbps = 1000 Kbps) avant compression.

Avant d’être transmis via des connections numériques, les signaux audio et vidéo doivent être numérisés et ensuite comprimés pour réduire le débit très important de données à transporter. Cette compression est effectuée au moyen d’un CODEC (COdeur - DEcodeur)

Les systèmes numériques se caractérisent par une différence du temps de transmission (délai de codage/décodage compris) selon que le signal soit audio ou vidéo. Il en résulte un décalage fluctuant entre le son et l’image qui a des conséquences sur la synchronisation.

 

3.  Normes ISO-MPEG

MPEG (Moving Picture Experts Group) est le nom donné à une famille de normes internationales  destinées à codifier les données audio-visuelles dans un format numérisé comprimé. La famille MPEG est composée des normes MPEG-1, MPEG-2 and MPEG-4, respectivement identifiées comme ISO/IEC-11172, ISO/IEC-13818 and ISO/IEC-14496.

La norme MPEG-2 (IS0-13818) est celle généralement utilisée pour la transmission numérique des images TV. La transmission des images selon la norme ITU-R 601 demanderait environ 4, voire 25 à 34 Mbps pour des images HDTV (1920x1080 pixels et 60 images/seconde).

Les normes MPEG-Audio Layer 1,2 ou 3, par ordre de complexité et de performance croissantes, s’appliquent à la partie audio.

 

4.   Normes 320.x de l’Union Internationale des Télécommunications

Famille de normes applicables aux vidéoconférences, en matière de transmission audio et vidéo par ligne téléphonique ordinaire (H324), RNIS/ATM (H320-H321-H310) ou réseaux locaux (H322).

H.320 se base sur un algorithme de compression vidéo H.261 à deux types de résolution:

CIF (Common Interchange Format):

luminance: 352 échantillons par ligne, 288 lignes par image

couleurs:    176 échantillons par ligne, 144 lignes par image

QCIF (Quarter Common Interchange Format)

luminance: 176 échantillons par ligne, 144 lignes par image

couleurs:      88 échantillons par ligne,   72 lignes par image

Les normes H.320 permettent d’atteindre un débit de 30 images/seconde maximum.

La famille H.320 couvre trois normes audio applicables aux codecs:

·      G.711, avec un débit  de 64 Kbps, offre une qualité audio de 3-kHz, niveau téléphone;

·      G.722, avec un algorithme de meilleure qualité, atteint 7.5-kHz pour 64 Kbps de débit;

·      G.728 donne une qualité audio proche du niveau téléphone (3.4 kHz), pour 16 Kbps seulement.

H.310 et H.321 adaptent la famille H.320 à de nouveaux protocoles de transport tels que ATM et RNIS à bande large. H.310, par exemple, utilise l’algorithme de compression vidéo ISO MPEG-2, qui permettrait d’obtenir une qualité d’image haute définition.

ITU a élaboré une série de recommandations T.120, qui définissent les normes applicables aux vidéoconférences H.32x en matière d’échange de documents.


 [FR2]Note