À la rencontre des « raters », petites mains des « big data »

Loin du campus Google… Niharb / Flickr, CC BY-NC-ND

L’utilisation intensive des algorithmes dans l’industrie du numérique semble dessiner les contours d’un modèle de création de valeur sans intervention humaine. Voilà encore de quoi fabuler allègrement sur la « fin du travail ». Mais c’est précisément lorsque le mythe du « tout automatisé » semble se concrétiser qu’il se révèle illusoire. Car les machines, même apprenantes, laissent toujours vierge un territoire de tâches et d’activités.

Les raters constituent une figure à la fois emblématique et peu connue du travailleur oeuvrant dans l’industrie de la donnée. On ne sait pas combien ils sont, encore moins qui ils sont.

Étudiants, homeworkers, femmes au foyer, précaires des cinq continents, ils travaillent indirectement pour Google, Amazon ou Microsoft. Ils s’appellent eux-mêmes human raters quand le langage plus officiel des intitulés les baptise Internet evaluators ou Internet assessors. On connaît peu les entreprises de sous-traitance qui se chargent de rémunérer leurs prestations et d’organiser une vente de travail de masse, chronométré à la seconde près. Enfin, on ne sait pas toujours ce que font précisément ces raters, si ce n’est qu’ils travaillent en ligne sur leur propre outil de travail (un ordinateur ou un smartphone) et qu’ils sont payés pour compléter, faciliter ou évaluer le « travail » des algorithmes.

Les extraits de l’entretien qui suit, mené en 2015 avec un rater de la sous-traitance pour Google, donnent une illustration suggestive de la réalité d’un travail laissé dans l’ombre des discours convenus sur les « big data ».


Rater, mode d’emploi

Et la première fois que t’as bossé, comment ça s’est passé ?

T’as un site, t’as tes « login » [il me montre]. T’as une plate-forme de travail, et t’as le travail qui tombe. C’est comme un panier de travail. Y’a du travail qui tombe dedans. Quand t’arrives, y’en a de dispo ou pas, et tu dois choper le travail quoi.

Un panier ? C’est curieux ça.

C’est ça.

Ah, et ton espace de travail, ça s’appelle le Rater Aid !

Ouais, c’est ça. Ça, c’est un nom de domaine qui appartient à Google, si je dis pas de bêtises […]. Alors tu vois, là j’ai plusieurs trucs disponibles dans le panier. Ça, c’est la page d’accueil de l’espace de travail. T’as des tâches disponibles. « Experimental », tu sais jamais ce que ça va être. Comme son nom l’indique, ils font des expériences quoi. Quand tu cliques sur « expérimental », tu ne sais pas à quoi t’attendre.

Et les tâches, c’est des micro-tâches ?

Une tâche, ça va de 30 secondes à un quart d’heure. Ça dépend vraiment de ce que tu fais. Le volume de travail disponible est super changeant, et le travail en lui-même est super différent. Des fois t’as des tâches qui durent littéralement 30 secondes, et les plus longues que je fais moi elles durent 13 min 50. Et tu fais des trucs à l’oreille, tu fais des trucs au clavier, etc.

Et le taux horaire est toujours le même ?

Oui. Toujours. T’es payé à l’heure en fait [nda : taux fixe de 13,90 €/h]

Le travail des « raters » consiste aussi à vérifier la pertinence des réponses des applications de type « Siri » lors des demandes des utilisateurs. Iphonedigital/Flickr, CC BY-SA

« Your money, your life »

_Tu vois, le chrono il a démarré, là, je vois le temps qu’il me reste pour cette tâche-là, 8 min 50. Ici, c’est le temps total que j’ai travaillé aujourd’hui, et là, c’est le temps qu’il me reste – pas pour cette tâche-là, mais pour un temps global que j’ai accumulé. Tu vois, c’est un peu plus que les 8 min, parce que j’ai accumulé 1 min de temps supplémentaire en travaillant ce matin dans le train. Ce type de tâche-là, c’est du « quality rating », on te donne une page Internet, tu dois aller la checker, et tu dois la noter selon toute une grille de notation fournie par Google.

Tu vois, là, la page à noter c’est sur le site de Sud-Ouest, le quotidien. C’est un article de news sur le crash de l’avion, la page est récente. Bon, Sud-Ouest, de toute façon, je sais qu’il est bien… Normalement, t’es censé analyser plein de trucs et les noter ensuite. Sud-Ouest, je l’ai fait des tas de fois, donc je sais ce que je vais mettre ; ça me fait gagner du temps. Tu vois, on te demande : « Est-ce qu’il y a du porn ? Est-ce que c’est une langue étrangère ? Est-ce que la page n’a pas chargé ? » Bon, là, je ne coche rien. On te demande « Quel est le but réel de la page ? » Donc là, tu t’emmerdes pas, tu mets « a news article about a plane crash ». On te demande : « Est-ce que cette page est malicieuse, dangereuse, trompeuse, ou manque d’utilité ? » Donc je mets « Non ». « Est-ce que le but de la page est de faire de l’argent sans fournir quoi que ce soit à l’utilisateur ? » Je mets « Non ».

Et « Est-ce que c’est “ymyl” ? », ça veut dire « Your money, your life ». C’est une catégorie qu’on t’explique dans les « guidelines ». C’est toutes les pages qui sont susceptibles d’impacter la vie future de l’utilisateur d’une manière qui pourrait avoir des conséquences légales graves : information médicale, information légale, transaction financière et informations sensibles. Tout ça, c’est des sites où tu dois placer la barre au plus haut niveau de confiance. Là je mets « Non ».

Si c’est un site avec un formulaire à remplir, c’est « ymyl » ?

Par exemple, si c’est un site où tu fais des achats, ça va être « ymyl shopping ». Pareil pour un site d’infos médicales. Et si le site n’est pas référencé ou si c’est pas un site sérieux, il va se prendre une claque. Mais pour Sud-Ouestc’est pas le cas. Et ensuite tu as la grille à remplir, je te le fais très rapidement. On te demande « Qualité du contenu principal ».

Tu le lis pas ?

Non.

Évaluer et vérifier, à toutes les sauces

Et alors, t’es exposé à des images parfois un peu choquantes ?

Pas sur YouTube, parce que YouTube, ils sont assez forts pour éliminer automatiquement tout ce qui est porno, gore, etc. Mais après il y a des trucs légitimes. Par exemple, sur YouTube, une scène de film où il y a plein de gros mots, ils vont pas virer ça, c’est légitime. Par contre, quand il y a le “safe search”, le contrôle parental qui est activé, il faut pas qu’un enfant tombe là-dessus. Donc moi, ça ne me pose pas de problème d’être exposé à ça. En revanche, tu travailles pas mal sur le porno aussi… Parfois, pendant une semaine, je vais faire le même type de tâche.

[…]

Ce que tu fais, c’est noter des pages. Ça ne demande pas de connaissances en codage, c’est pas de la programmation, c’est pas de l’informatique. […] Et juste pour te faire une petite liste des types de tâches qui existent, t’as les « side-by-side », t’as une requête de l’utilisateur, tu notes deux listes de résultats différentes. T’as aussi le « page result » qu’on a fait avec « Sud-Ouest ». Ces deux-là, c’est les principaux. Ensuite, t’as « book search », c’est pour les gens qui font des recherches sur Google Books. Ils font une recherche et on vérifie si c’est le bon livre, la bonne page, est-ce que c’était utile ou pas, est-ce que le résultat est pertinent. Il y a aussi « duplicate images », donc là tu fais de la chasse au doublon dans les images dans Google Images. Donc on te présente un mur d’images et c’est comme les jeux de mémoire, comme un Mémory : tu sélectionnes les doublons et voilà, c’est tout. C’est assez facile d’ailleurs.

Et ça, c’est des petites tâches qui se font très très vite ?

Non, ça c’est un quart d’heure. Mais c’est parce que t’as un mur d’images énorme. Tu vois une requête qu’un mec a fait, t’as un mur d’images énorme, tu dois sélectionner les doublons pour qu’il ne les présente pas en double. Tu dois voir dans le doublon, lequel est de meilleure qualité. Ça prend du temps quand même. Il y a aussi le « Google Now », ça c’est ce qu’ils appellent les « device actions ». Attention, là on rentre dans le genre de truc qui fait flipper les gens quand je leur dis. C’est quand tu notes la pertinence d’une action que le téléphone a faite quand une personne lui a demandé, à son téléphone, de faire quelque chose. Typiquement : « Envoie un message à Sarah, dis-lui que j’arrive dans 15 minutes. »

Il peut faire ça, le téléphone ?

Ouais. Donc moi je passe derrière, j’entends le mec dire ça, je vois où il était, à quelle heure il l’a fait, et qui reçoit le message.

C’est des vraies données ?

C’est des vraies données. Ah, tu l’entends, le mec, tu l’entends parler ! Ça, tu vois, c’est limite [il s’esclaffe], c’est un peu flippant. C’est anonymisé, mais tu vois l’heure exacte, l’emplacement à la rue près sur Google Maps, et puis tu l’entends la personne. Mais en même temps, bon, il a cliqué sur « J’accepte les conditions d’utilisation d’Android », voilà, quoi. S’il dit à son téléphone : « Emmène-moi rue d’Ulm », et bien moi il faut que je vérifie que le téléphone a bien lancé la requête sur le GPS, qu’il a bien calculé le bon itinéraire, etc., des vérifications comme ça.

Les raters peuvent travailler depuis n’importe quel lieu et sont payés à la tâche pour un taux horaire fixe. Avi Richards/Unsplash, CC BY

« Le dernier ouvrier de la chaîne »

Mon taf, il existe parce que, aujourd’hui, on n’est pas capables de faire des machines aptes à comprendre le contexte des choses, d’aller plus loin que les instructions qui leur ont été données, et donc on est obligés de faire appel à de l’intelligence humaine pour faire le boulot que je fais. Si tu me demandes ce que c’est mon boulot et ce que j’en pense, je dirais que c’est une des étapes nécessaires dans le chemin vers l’intelligence artificielle.

Tu vois, aujourd’hui, les chaînes de montage de voitures automatisées ? Avant, c’était des gens qui le faisaient, ben je suis un peu cet exécutant-là sur la chaîne, qui un jour sera remplacé par un robot. Sauf que ça sera un robot d’intelligence artificielle. Et ce que je fais moi d’ailleurs, c’est du travail à la chaîne. C’est là qu’ils ont été intelligents chez Google. Quand ils ont fait leur moteur de recherche, ils se sont pas dit : « On va faire un annuaire de sites rempli à la main. » Avant ça existait, les annuaires de sites avec des gens qui remplissaient les rubriques, qui notaient les pages, etc. C’était avant le PageRank, qui fait ça automatiquement. Avec l’algorithme, c’est du passage à la chaîne. Moi, je suis le dernier ouvrier de la chaîne, qui est encore là parce qu’il y a encore un dernier truc qu’on ne sait pas faire faire à une machine.

Les tâcherons du XXIe siècle

Les raters ne sont pas les seules « petites mains » de l’industrie de la donnée. Les plates-formes numériques mobilisent de nombreux autres crowd workers, sorte de tâcherons du XXIe siècle, payés pour « tagger » des images et des vidéos, classer des contenus, faire de la reconnaissance de texte, traduire ou réécrire des fragments de texte, ou encore retranscrire des enregistrements oraux.

Tout un secteur d’emploi supranational émerge et se développe en-dehors du salariat, de la protection sociale et des réglementations qui l’accompagnent. Parler d’« ubérisation » serait inapproprié s’agissant d’une main d’œuvre qui n’a pas connu le salariat et le contrat de travail.

Au-delà de l’essaimage par les plates-formes numériques, l’industrie de la donnée exploite une autre forme d’énergie humaine que la recherche et les médias ont contribué à faire connaître. Il s’agit des traces numériques occasionnées par notre usage quotidien d’Internet et des objets connectés. Cette matière première issue de l’activité humaine est souvent considérée comme du « travail », au sens où elle participe de la création de valeur pour les entreprises du numérique, n’est pas le propos qui nous intéresse ici. Il est plutôt de souligner que même les univers les plus algorithmés sont consommateurs de main d’œuvre. Irréductible travail humain ?


Lire le chapitre écrit par Simon Paye dédié aux « raters » dans « Big data et traçabilité numérique », ouvrage collectif, disponible en ligne et en papier, dirigé par Pierre-Michel Menger et Simon Paye, publié aux éditions du Collège de France, octobre 2017.

Found this article useful? A tax-deductible gift of $30/month helps deliver knowledge-based, ethical journalism.