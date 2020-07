Que l’on soit au travail, entre amis ou en famille, en face à face ou au téléphone, la conversation orale est au cœur de notre vie sociale. Si la communication écrite connaît un essor considérable à l’heure d’Internet, des smartphones et des réseaux sociaux, la conversation orale reste le support privilégié de nos échanges interindividuels, dès les premières années de la vie, et dans toutes les sociétés humaines.

Sans fil conducteur établi d’avance, la conversation est souvent sa propre raison d’être : on parle pour parler, de la pluie et du beau temps, de tout et de rien. Dans bien des cas, l’objectif premier n’est pas tant d’échanger des informations, que de nous engager dans ce mode particulier d’être avec autrui.

De récentes études réalisées sur des corpus de parole conversationnelle, ont d’ailleurs fait apparaître la faible richesse de ces échanges sur le plan informationnel. Auriez-vous imaginé que « mh », « ah », ou « voilà », fassent partie des formes les plus fréquemment produites par les locuteurs ? C’est l’un des multiples éléments montrant que la conversation fait souvent prévaloir la dimension interactionnelle du langage oral, vis-à-vis de ce dont le langage peut nous permettre de parler.

L’orchestration d’une conversation est soumise à la manière dont nos énoncés sont agencés, et notamment au caractère linéaire de cet agencement. Chaque énoncé que nous produisons possède un début, un milieu et une fin, et notre interlocuteur doit traiter les différents éléments de l’énoncé au fur et à mesure que ces éléments lui parviennent. Les conversations sont ainsi organisées sous une forme qui reflète la structure du langage lui-même. Mais les recherches actuelles sur la parole conversationnelle nous amènent également à repousser les frontières du langage, telles que ces frontières ont pu être établies par la linguistique contemporaine depuis son avènement.

Par exemple, le son « mh » dont nous avons fait mention – et que l’on décrit techniquement comme une consonne nasale non relâchée – n’a pas été jusqu’à présent considéré par les phonologues comme faisant partie des consonnes du français. Cela est vrai aussi de ces sons bien particuliers que l’on appelle des clics, et que nous émettons souvent dans nos conversations en français, bien qu’on ne les fasse pas figurer dans notre système consonantique. Des travaux récents ont mis en évidence le rôle central de ces sons « à la marge du langage » dans nos interactions conversationnelles.

Une conversation se présente souvent comme un exercice de libre association pratiqué à deux ou à plusieurs. Son point d’aboutissement est rarement prévisible, et elle peut emprunter de nombreux détours inattendus. Il nous arrive d’ailleurs de revenir en arrière avec notre interlocuteur, afin de savoir « comment on en est arrivés à parler de ça ». Mais derrière cette apparente liberté dans le déploiement de nos conversations, se dissimule un système bien établi de règles de construction, et que chacun respecte sans l’avoir jamais appris de manière explicite. Les recherches menées sur la conversation aujourd’hui visent à mieux comprendre ce système de règles, à étudier de quelle manière il se met en place chez l’enfant, et à déterminer s’il présente des caractéristiques communes à toutes les langues humaines.

Des principes partagés : Alternance et coopération

Tous nos échanges sont le résultat d’efforts de coopération visant à suivre une ligne commune afin de satisfaire certains objectifs. Qu’il s’agisse d’un bref échange de salutations ou d’une réelle conversation, nous obéissons pour ce faire à des règles et des principes qui fondent un réel système. Harvey Sacks et ses collègues ont mis en lumière l’organisation qui sous-tend l’alternance de parole. Une seule personne parle à la fois, selon le schéma ABABAB (A et B : les deux locuteurs). La durée des intervalles entre tours est minimisée (principe « no gap »), tout comme celle des chevauchements entre tours (principe « no overlap »).

Ce modèle rend compte des techniques d’allocation des tours et des lieux possibles de transition de parole. Un locuteur peut ainsi sélectionner le locuteur du tour suivant en lui adressant une question. Ce faisant, il exerce une contrainte sur son interlocuteur en l’enjoignant à répondre, comme en témoignent des remarques telles qu’« alors, je t’ai posé une question ! » quand cette contrainte n’est pas satisfaite.

La réponse forme avec la question une paire adjacente : le premier élément de la paire appelle, ou projette, un type d’énoncé spécifique (le second élément). Ce pouvoir projectif qui s’exerce au sein des paires adjacentes renvoie à une organisation préférentielle selon laquelle, parmi les différentes suites pouvant être choisies par le locuteur B, il en est une que le locuteur A préfère aux autres. Par exemple, l’acceptation, plutôt que le refus, est la réponse préférée à une offre ou une invitation.

L’organisation préférentielle favorise la poursuite du discours et maximise la coopération, en minimisant les conflits. Dans ces paires adjacentes, le deuxième élément prend nécessairement place après la fin du premier. De manière plus générale, le locuteur B prend le tour en des lieux bien précis dans le décours de la conversation, que l’on appelle des lieux de transition pertinents.

Une orchestration temporelle de haute précision

Lorsque nous conversons, nous ne cessons de traquer dans le discours de l’autre les éléments qui nous permettront de réagir de manière appropriée en respectant le bon timing. Observons une conversation et remarquons combien nos tours de parole s’enchaînent le plus souvent harmonieusement. Nous n’en avons pas conscience, mais prendre ou céder la parole exige une minutie remarquable. Des études ont montré qu’un délai de 100 à 300 ms serait la règle entre les tours de parole, et ce indépendamment des langues considérées. Ce délai paraît extrêmement court. On estime en effet qu’il nous faut en moyenne 600 ms pour produire un mot (de l’intention de produire ce mot, à sa prononciation). Si nous sommes si rapides dans l’enchaînement entre tours, c’est parce que nous préparons le tour d’après pendant celui de notre interlocuteur, dont nous sommes capables de prédire la fin, grâce à différents indices de projection (syntaxique, prosodique, mimogestuel, etc. ; par exemple, le fait de pointer notre menton vers notre interlocuteur peut constituer un indice gestuel indiquant que nous lui cédons la parole).

L’organisation préférentielle éclaire également cette question de timing. Si une réponse préférée apparaît généralement dans le délai moyen, son alternative non préférée peut apparaître tardivement (1 seconde ou plus) et comporter des éléments d’excuse ou d’hésitation qui révèlent explicitement une transgression des attentes.

Le rôle actif de l’auditeur

D’autres marques explicites évoquant « l’art de la conversation » renvoient aux « mh », « ok », mouvements de tête ou de sourcils qui remplissent nos conversations. Si l’on cherche à se remémorer le contenu d’un échange, il est coutumier de ne pas faire état de ces feedbacks. En revanche, une conversation qui en serait emplie, ou au contraire dépourvue, peut laisser une impression de malaise, comme si le courant n’était pas ou mal passé.

Cette impression est liée au fait que ces items de feedbacks sont loin d’être de simples réactions anarchiques et désordonnées. De fait, ils font système, et ne dérogent pas aux règles et principes de la conversation. Ils reflètent la coopération entre les participants et influent sur la progressivité du discours.

De plus en plus d’études s’accordent sur leur rôle crucial pour favoriser la compréhension mutuelle entre les locuteurs. Outre leurs fonctions d’acquiescement ou d’évaluation de l’énoncé précédent, ils ont également un impact sur l’énoncé suivant.

Quand on raconte une histoire, ce qui est une activité très fréquente en conversation et qui place notre interlocuteur en situation d’écoute, notre récit est de meilleure qualité lorsque l’interlocuteur contribue activement, via ses différents feedbacks, à son élaboration. Par ailleurs, un froncement de sourcil exprimant une incompréhension rompt ponctuellement la progressivité du discours. Ce mouvement de sourcil oriente ainsi le discours vers une trajectoire interactionnelle spécifique de réparation du trouble qui permettra à l’interlocuteur de raccrocher pour que l’interaction s’accomplisse avec succès.

Toutes les études le montrent : si la conversation peut former cet espace interactionnel dans lequel on baguenaude à deux ou à plusieurs avec autant de liberté, cela tient, paradoxalement, à ce qu’elle est orchestrée avec la précision d’une œuvre musicale, et repose sur un ensemble bien établi de règles et principes, que nous respectons sans y penser, et sans les avoir appris de manière explicite. La conversation possède sa propre grammaire, que les chercheurs s’attachent aujourd’hui à mettre au jour.