Éthique et traitement automatique des langues : ce dont on parle, ce dont on ne parle plus, ce dont on ne parle pas (un état de l'art)
Éthique et traitement automatique des langues : ce dont on parle, ce dont on ne parle plus, ce dont on ne parle pas (un état de l'art)
résumé
Depuis quelques années, l'éthique est devenue un sujet reconnu dans les domaines de l'IA et plus particulièrement dans le traitement automatique des langues (TAL). Cette évolution récente est due à plusieurs facteurs, dont le fait que le TAL est devenu suffisamment intéressant commercialement pour sortir des laboratoires de recherche et envahir nos vies quotidiennes, avec des conséquences immédiatement visibles pour le grand public. Je reviendrai dans cette présentation sur l'évolution qu'a connu le sujet sur la dernière décennie, qui a vu certaines problématiques devenir évidentes (comme la rémunération des travailleurs du clic) et ne plus être discutées, alors que d'autres (notamment les biais des modèles de langues) occupent le devant de la scène, occultant les questions les plus difficiles. Une large place sera laissée à la discussion, afin de permettre des échanges de vues sur ces sujets.
Biographie
Karën Fort est Maîtresse de conférences en informatique à Sorbonne Université et effectue sa recherche au LORIA à Nancy. Celle-ci porte à l'origine sur l'annotation manuelle pour le traitement automatique des langues (TAL), étendue à l'annotation par myriadisation (crowdsourcing), en particulier en utilisant les jeux ayant un but. Karën Fort s'intéresse également depuis une dizaine d'années à l'éthique dans le TAL, notamment à l'impact de la myriadisation (Fort et al 2011). Elle a organisé la première journée d'étude sur le sujet en 2014, à Paris, suivie d'un atelier à TALN (ETeRNAL) et d'un numéro spécial de la revue TAL en 2016. Elle est à l'origine du blog éthique et TAL (http://www.ethique-et-tal.org/), ainsi que de la première étude sur l'éthique dans le TAL (Fort & Couillault, 2016). Elle a été co-présidente des deux premiers comités d'éthique de conférences du domaine (EMNLP 2020 et NAACL 2021) et est aujourd'hui co-présidente du comité d'éthique de l'association for computational linguistics (ACL).