1. Les chatbots utilisent une intelligence artificielle qui ingère une quantité gigantesque de textes provenant principalement d'Internet pour imiter la parole humaine.
2. Les entreprises technologiques sont secrètes sur les données qu'elles fournissent à l'IA, mais une analyse du Washington Post a révélé que les sites Web utilisés pour former l'IA comprenaient des sites de piratage, des sites de propagande et des blogs personnels.
3. Les chatbots peuvent propager des informations incorrectes et biaisées s'ils sont formés avec des données non fiables, ce qui soulève des préoccupations quant à leur utilisation dans la propagation de la désinformation et de la propagande.
L'article du Washington Post intitulé "See the websites that make AI bots like ChatGPT sound so smart" analyse les données utilisées pour entraîner les chatbots d'IA et révèle les types de sites web qui sont inclus dans ces données. L'article souligne que les chatbots ne peuvent pas penser comme des humains, mais qu'ils peuvent imiter le langage humain en raison de l'énorme quantité de texte ingérée par l'IA, principalement collectée sur Internet. Le Post a analysé un ensemble de données pour révéler les types de sites web utilisés pour former l'IA, classant 10 millions de sites web en fonction du nombre de "tokens" apparaissant dans l'ensemble de données.
Cependant, l'article présente certains biais potentiels. Tout d'abord, il se concentre sur les risques potentiels liés à la formation des chatbots d'IA sans aborder suffisamment les avantages et les opportunités offerts par cette technologie. De plus, il utilise des exemples extrêmes tels que des sites Web promouvant la suprématie blanche ou la propagande russe pour illustrer ses points, ce qui peut donner une image exagérée et sensationnaliste des risques associés à l'utilisation de chatbots d'IA.
En outre, l'article ne fournit pas suffisamment d'informations sur la méthodologie utilisée pour analyser les données et ne précise pas si toutes les sources ont été vérifiées ou si certaines ont été exclues en raison de leur contenu inapproprié. Il n'y a également aucune mention des efforts déployés par Google ou d'autres entreprises pour filtrer le contenu inapproprié lorsqu'elles entraînent leurs chatbots d'IA.
Enfin, l'article ne fournit pas suffisamment de contexte sur les avantages et les inconvénients de l'utilisation des chatbots d'IA dans différents domaines tels que la médecine, le journalisme ou la finance. Il ne mentionne pas non plus les efforts déployés par les entreprises pour garantir que les chatbots d'IA soient utilisés de manière éthique et responsable.
Dans l'ensemble, bien que l'article soulève des préoccupations légitimes concernant la formation des chatbots d'IA, il manque de contexte et présente certains biais potentiels qui peuvent donner une image exagérée des risques associés à cette technologie.