Les travailleurs des données détaillent l'exploitation par l'industrie technologique dans le rapport DAIR

Le travail essentiel des données, tel que la modération et l'annotation, est systématiquement caché à ceux qui bénéficient des fruits de ce travail. Un nouveau projet met en lumière les expériences vécues des travailleurs des données du monde entier, montrant de première main les coûts et les opportunités du travail technologique à l'étranger.

De nombreuses tâches ennuyeuses, ingrates ou psychologiquement dommageables ont été externalisées vers des pays plus pauvres, où les travailleurs sont heureux de prendre des emplois pour une fraction du salaire américain ou européen. Ce marché du travail rejoint d'autres emplois de la catégorie "ennuyeux, sales ou dangereux" comme le "recyclage" électronique et le démantèlement de navires. Les conditions de travail en modération ou en annotation ne sont pas aussi susceptibles de vous coûter un bras ou de vous donner un cancer, mais cela ne les rend pas sûres, encore moins agréables ou gratifiantes.

L'enquête des travailleurs des données, une collaboration entre le groupe de recherche en éthique de l'IA DAIR et l'Université technique de Berlin, est nominativement modelée sur le travail de Marx à la fin du XIXe siècle identifiant les conditions de travail dans des rapports "collectivement produits et politiquement applicables".

Tous les rapports sont disponibles gratuitement et ont été lancés aujourd'hui lors d'un événement en ligne où les personnes à l'origine du projet en ont discuté.

L'expansion constante du champ d'application de l'IA repose par nécessité sur l'expertise humaine, et cette expertise est achetée à ce jour au plus bas dollar que les entreprises peuvent offrir sans encourir de problème de relations publiques. Lorsque vous signalez un message, cela ne dit pas "super, nous enverrons cela à un gars en Syrie qui sera payé 3 cents pour s'en occuper." Mais le volume de rapports (et de contenu méritant un rapport) est si élevé que d'autres solutions que l'externalisation massive du travail vers des marchés de main-d'œuvre bon marché ne sont pas vraiment logiques pour les entreprises impliquées.

Parcourant les rapports, ils sont largement anecdotiques, et délibérément. Ces rapports relèvent plus du niveau de l'observation anthropologique systématique que des analyses quantitatives.

La quantification de ces expériences échoue souvent à capturer les coûts réels - les statistiques auxquelles vous aboutissez sont du type que les entreprises adorent exhiber (et donc solliciter dans les études) : des salaires plus élevés que d'autres entreprises de la région, la création d'emplois, des économies répercutées sur les clients. Rarement des choses comme les travailleurs de la modération qui perdent le sommeil à cause de cauchemars ou une dépendance chimique généralisée ne sont mentionnées, encore moins mesurées et présentées.

Prenons le rapport de Fasica Berhane Gebrekidan sur les travailleurs des données kényans luttant contre des problèmes de santé mentale et de toxicomanie. (Le PDF complet est disponible ici.)

Elle et ses collègues ont travaillé pour Sama, qui se présente comme un pipeline de travail de données plus éthique, mais la réalité de l'emploi, telle que la décrivent les personnes réelles, est une misère incessante et un manque de soutien du bureau local.

Une image du lieu de travail de la modération à Samasource au Kenya.
Crédits d'image : Fasica Berhane Gebrekidan

Recrutés pour gérer des tickets (c'est-à-dire du contenu signalé) dans des langues et dialectes locaux, ils sont exposés à un flux incessant de violence, d'horreur, d'abus sexuels, de discours haineux et d'autres contenus qu'ils doivent regarder et "traiter" rapidement sous peine de baisser en dessous des niveaux attendus, ce qui entraîne une diminution de leur salaire, indique le rapport. Pour certains, cela représente plus d'un par minute, ce qui signifie qu'ils visualisent un minimum d'environ 500 éléments par jour. (Au cas où vous vous demanderiez où est l'IA ici - elle fournit probablement les données d'entraînement.)

"C'est absolument anéantissant. J'ai vu les pires choses que l'on puisse imaginer. J'ai peur d'être traumatisé à vie pour avoir fait ce travail," a déclaré Rahel Gebrekirkos, l'une des contractantes interrogées.

Le personnel de soutien était "mal équipé, peu professionnel et sous-qualifié", et les modérateurs se tournaient fréquemment vers la drogue pour faire face, se plaignant de pensées intrusives, de dépression et d'autres problèmes.

Nous avons déjà entendu certaines de ces histoires, mais il est pertinent de savoir que cela se passe toujours. Il y a plusieurs rapports de ce type, mais d'autres sont plus des récits personnels ou adoptent des formats différents.

Par exemple, Yasser Yousef Alrayes est un annotateur de données en Syrie, travaillant pour financer ses études. Lui et son colocataire travaillent ensemble sur des tâches d'annotation visuelle comme l'analyse d'images de texte qui, comme il le souligne, sont souvent mal définies, avec des demandes frustrantes de la part des clients.

Il a choisi de documenter son travail sous forme de court métrage qui vaut bien huit minutes de votre temps.

Des travailleurs comme Yasser sont souvent dissimulés derrière de nombreuses couches organisationnelles, agissant en tant que sous-traitants de sous-traitants de sorte que les lignes de responsabilité sont obscurcies en cas de problème ou de litige.

Mme Milagros Miceli de DAIR et de l'Université technique de Berlin, l'une des responsables du projet, m'a dit qu'ils n'avaient vu aucun commentaire ou changement de la part des entreprises indiquées dans le rapport mais qu'il était encore tôt. Mais les résultats semblent assez solides pour les inciter à en demander plus : "Nous prévoyons de poursuivre ce travail avec un deuxième groupe de travailleurs des données," a-t-elle écrit, "probablement du Brésil, de la Finlande, de la Chine et de l'Inde."

Nul doute que certains rejetteront ces rapports pour la qualité même qui les rend précieux : leur nature anecdotique. Mais alors qu'il est facile de mentir avec des statistiques, les anecdotes portent toujours au moins un peu de vérité en elles, car ces histoires sont prises directement à la source. Même s'il s'agissait des seuls douze modérateurs au Kenya, en Syrie ou au Venezuela ayant ces problèmes, ce qu'ils disent devrait préoccuper quiconque dépend d'eux - c'est-à-dire, à peu près tout le monde.