[alerte] hors série 29 janvier 2014

Esprit critique face à ce qui circule sur les médias numériques

    Le problème de la vérification des sources 

La rumeur

Les canulars

Éducation aux médias ?

    Nature de l'information et de la connaissances produites par les systèmes numériques

Moteurs de recherche

Traitement des « big data », données massives

JM Bérard, 29 janvier 2014

Je pense qu'il y a péril.

Je pense que tout circule sur les médias numériques, et donc n'importe quoi (car le « n'importe quoi » fait partie du « tout »). Je pense que l'école doit prendre une part très active à la formation des citoyens pour les mettre à même de faire face à tout cela.

Je pense que l'expression actuellement employée par le ministère de l'éducation nationale pour évoquer cette question manque de spécificité, elle est trop diluée, ne tient pas compte des caractères propres au numérique : éducation aux médias, dit-on. Cela ne suffit pas.

Pourquoi cet envoi spécial de [alerte] sur un sujet que j'aborde pourtant souvent ? Parce que, ce 29 janvier 2014, je suis « secoué » par plusieurs informations, d'apparences disparates et d'importance inégale mais qui convergent vers la question : quels outils le système éducatif doit-il donner aux citoyens pour se repérer dans la jungle opaque des informations diffusées par les outils numériques ?

1 Le problème de la vérification des sources :

Deux exemples récents attirent mon attention :

La rumeur

Mobilisés par SMS, des parents retirent leur enfant de l'école. On leur a dit que l'on va à la maternelle apprendre aux enfants à se masturber, leur montrer des images porno et leur expliquer que c'est à eux, enfants, de choisir s'ils veulent être fille ou garçon. Évidemment ce message ne comporte aucun élément permettant de vérifier. Cela prend aux tripes, certains croient ce qui est écrit. On n'a pas appris le réflexe de survie pour se dire « d'où ça vient, pourquoi on me dit cela ? » Ce qui est écrit est justement ce que j'ai envie de croire, je le crois.

J'en ai parlé à un ou deux amis qui m'ont dit « il est pourtant vrai que le ministère diffuse un document où l'on explique que les garçons peuvent aussi jouer à la poupée et les filles au garage d'autos. » Je l'ai échappé belle : je voulais offrir à ma petite-fille un garage d'autos pour Noël, mais elle en avait déjà un. J'ai donc acheté une poupée. Ouf.

Je pense d'ailleurs que les réactions immédiates et judicieuses du ministre, des syndicats, des enseignants n'auront que peu d'effet. Il est quasi-impossible de lutter contre une rumeur. En 2014, des années après (1969) on continue de penser que les femmes disparaissent dans les cabines d'essayage des magasins de vêtement d'Orléans tenus par les commerçants juifs et qu'elles sont livrées à un réseau de prostitution grâce à un sous-marin circulant sur la Loire. (Vous êtes peut-être trop jeunes : tout cela a vraiment circulé avec ténacité.) Bon, quel rapport avec le numérique, il y a toujours eu des rumeurs, on a brûlé beaucoup de sorcières. Oui mais le numérique offre à la diffusion de ces rumeurs des outils d'une puissance inégalée : instantanée, impossible à démentir. Et efficace : les citoyens se sentent souvent bridés par la parole officielle, et sont ravis que des médias puissent enfin « librement » leur dire la vérité.

Le système éducatif est donc devant un défi presque insurmontable : comment à la fois expliquer aux enfants que la parole officielle (école, parents) peut comme toute autre être soumise à l'esprit critique, sans en même temps développer l'idée que tout ce qui est « contre » la parole officielle est juste ? Et comment faire cela en utilisant le canal « officiel » de l'école : je vous le dis, ne croyez pas ce que je dis... Je crois qu'est ainsi un peu interrogé (un peu...) un système trop uniquement transmissif, et que les pédagogies de la liberté de pensée rationnelle sont encore largement à inventer.

Les canulars

Un autre exemple d'apparence anodine mais assez révélateur. J'ai reçu un message expliquant que, rétroactivement à partir de janvier le gouvernement va rétablir la vignette auto. Ce message est immédiatement reconnaissable comme un canular : il n'est pas daté, pas signé, on ne trouve aucun lien vers des sites ou des données permettant de corroborer l'information. Qui plus est le message fait référence au ministre Jean-Marc Morandi. Jean-Marc Morandini est animateur télé, aucun ministre ne s'appelle Morandi. Et pourtant je le reçois, avec une question « qu'en penses-tu ? ». Je pense que si la personne qui me pose la question avait lu le message qu'elle m'envoie, elle aurait aussitôt vu que cela ne tient pas debout. Et si, comme chacun le fait lorsqu'il reçoit un message suspect, elle avait consulté le site hoaxbuster qui recense les hoax (canulars) elle aurait vu que ce message circule depuis près de trois ans. Comment un message aussi évidemment faux peut-il circuler trois ans ?

Éducation aux médias ?

Ces exemples ne sont que des exemples, mais ne sont pas anecdotiques. Dans le système éducatif français on a beaucoup, avec l'institution appelée Clemi, conduit un travail d'analyse critique des médias dans les classes : exemple parmi tant d'autres, comparer le même jour les unes des différents journaux écrits et télévisés. C'est un travail très utile. Mais les publications numériques changent la donne : une revue a un comité de rédaction, un journal un directeur de publication, un livre a un éditeur, avant publication il y a eu un filtrage. Et puis une fois imprimé le tout est déposé, cela fait foi. Rien de tel pour le numérique. Progrès de la liberté et en même temps progrès du n'importe quoi, chacun peut publier sur internet tout et le contraire de tout. A peu près sans limite car les lois qui, par exemple en France, répriment la diffamation, l'atteinte à la vie privée, la négation de la Shoah, le racisme ne s'appliquent pas toujours à l'étranger, il est très difficile de poursuivre.

J'avais écrit à ce sujet il y a très, très longtemps (1996) un article intitulé « la toile de Babel » dont de nombreux éléments sont toujours d'actualité. Vous pouvez lire ce texte en cliquant sur documents JM B puis simple clic (simple) sur le grand W bleu « toile de Babel ».

Il me semble donc que, très tôt, le système éducatif pourrait développer beaucoup plus chez les élèves le type d'attitude consistant à se demander « qui me dit cela, sur quoi cette affirmation est-elle fondée, comment puis-je en percevoir les limites de validité ?». C'est une attitude vitale de façon générale, pour tout ce qui concerne le débat argumenté entre les personnes, l'une des façons permettant de ne pas remettre à la violence la résolution de tous les désaccords.

Les informations trouvées grâce aux outils numériques doivent sur ce point faire l'objet d'une méthodologie particulière : date de l'information, sites qui la diffusent, indices permettant de se faire une idée de la fiabilité de l'auteur, méthodes pour croiser ces sources avec d'autres... De nombreuses université françaises ont mis au point des méthodologies efficaces pour les étudiants (c'est vital pour eux dans leur travail de rédactions de mémoires ou de thèses), de nombreuses écoles canadiennes familiarisent les élèves avec des outils de travail efficaces. Dans les écoles, les collèges et les lycées, tous les programmes parus dans les différentes disciplines insistent sur ce type de préoccupations, mais les outils méthodologiques à disposition des élèves et des enseignants sont à mon avis trop rares. Pourquoi ne pas en faire un recensement, une analyse et les mettre à disposition des enseignants sous forme de ressource nationale ? Pourquoi ne pas en créer lorsqu'il n'y en a pas suffisamment ?

Il me semble que le rôle de l'école ne se limite pas à l'enseignement du « lire écrire compter », qu'il y a aussi le parler, échanger avec d'autres, justifier un point de vue, savoir enchaîner un raisonnement. Et donc aussi être capable de faire preuve d'esprit critique dans l'analyse des sources de ce que diffusent les médias numériques.

2 Nature de l'information et de la connaissances produites par les systèmes numériques

De plus en plus de réflexions de sociologues, de philosophes nous conduisent à nous interroger sur la nature même de l'information et de la connaissance produite par les systèmes numériques.

Et du coup nous sommes invités à faire preuve d'une nouvelle forme d'esprit critique, qui vise non plus seulement à se demander « d'où cela vient, pourquoi me dit-on cela » mais « comment cette information, cette connaissance a-t-elle été produite, quelle perception puis-je avoir des conditions de cette production ? »

Les évolutions intervenues depuis une dizaine d'années (augmentation massive des capacités de mémoire et de calcul des machines, utilisation des moteurs de recherche et traitement des « big data », données massives) nous amènent à constater que c'est le processus même de création de la connaissance qui est bouleversé.

C'est déjà une évidence lorsque l'on prend en considération chaque champ de la connaissance pris séparément. Alors que les mathématiques étaient un exercice purement rationnel, les ordinateurs permettent maintenant dans certains cas de faire des démonstrations. Est-ce vraiment une démonstration, se demandent les historiens rigoureux de l'histoire de la pensée ? En physique, les simulations permettent de prévoir un grand nombre de situations, les traitements massifs de données permettent de dépouiller les résultats des expériences pour conclure à l'existence du boson de Higgs.

La photo, le cinéma sont radicalement bouleversés par l'usage du numérique, qui permet de faire un film avec de vrais acteurs, vivants ou morts, mais qui ne sont pas vraiment devant la caméra, de monter des scènes où se mêlent indistinctement le réel et le virtuel, et d'aboutir à vider de tout sens l'expression « c'est vrai, je l'ai vu ».

Mais, sans peut-être que nous y prenions garde, le numérique prend aussi le contrôle de certains de nos processus de pensée.

Moteurs de recherche

Des algorithmes prodigieusement astucieux alliés à un balayage constant des informations en ligne sur la toile permettent d'obtenir de façon stupéfiante une réponse quasi-instantanée à n'importe quelle question. Mais, on le sait bien maintenant, la façon dont les moteurs de recherche classent les résultats n'est pas transparente, elle fait partie pour chaque entreprise du secret commercial. Dans le commerce, dans la recherche courante d'informations, et peut-être aussi dans la recherche scientifique, ce qui n'est pas dans les dix premiers résultats de Google n'existe pas. Mais qu'est-ce qui est dans les dix premiers résultats ?

Certes, on doit, il faut à l'école apprendre les techniques logiques de recherche (fonctions et, ou, etc.) il faut apprendre à comparer les résultats donnés par différents moteurs, mais au total le processus de travail « intellectuel » de chaque moteur nous reste par principe opaque. Comment faire preuve d'esprit critique vis à vis d'un résultat dont rien ne permet d'apprécier les conditions d'élaboration ?

Et puis bien sûr le progrès apparaît. On nous annonce les moteurs de recherche sémantique, qui ne se limiteront pas à traiter les éléments de la requête comme des éléments abstraits (dans le mot arrivée, y a-t-il la lettre a ?) mais tenteront d'en comprendre le sens. Mazette. Le sens ! (J'emploie mazette comme expression d'étonnement. J'ignorais que cela désigne aussi un homme vieux et sans énergie. Oui, je travaille avec le Larousse en ligne.)

Un exemple recopié du site 01.com, copie faite le 20 1 2014 :

Éditeur français, Proxem présente à l’occasion du salon i-expo (qui se tenait les 12 et 13 juin), un outil de collecte de documents Web à même de « comprendre » les concepts formulés par l’utilisateur. Un mot clé pouvant avoir plusieurs sens – orange est à la fois un fruit et un opérateur mobile – et une idée plusieurs formulations, Proxem Discovery s’appuie sur des technologies sémantiques afin de « rendre le langage humain compréhensible et interprétable par les machines ». Technologies sémantiques ?

Petites remarques : comme c'est le cas en général sur l'internet, l'auteur ne sait pas que le temps passe et que sa prose reste : le salon se tenait en juin, mais on ne sait pas du tout de quelle année. Autre remarque : l'auteur semble oublier que orange est aussi une couleur, un fleuve d'Afrique, une ville du Vaucluse... (Oui, j'ai le Larousse en ligne).

Tout cela pour dire qu'avec le web sémantique on peut craindre le pire de la manipulation mentale, volontaire ou de bonne foi. Les chemins mis en œuvre seront si complexes qu'il sera bien difficile de les expliciter. Et du coup lorsque je tape « liberté » le moteur sémantique y a associera-t-il une idée de progrès style siècle des lumières ou une idée de danger style place Tien An Men ? Je crains comme la peste tous ces éléments de pensée qui fonctionneront à notre place, avec une efficacité fort plaisante, mais qui guideront insidieusement notre pensée. Allons, vous voyez le mal partout ! Il suffira d'être objectif ! Bien bien, je vois que nous avons devant nous de longs débats en perspective sur ce qu'est le langage, et ce que peut être le contrôle de la pensée, soit volontaire (liberté égale danger) soit résultant de l'idéologie dominante. Tant qu'à penser, autant essayer de penser par soi-même... Ou d'être aidé, mais à condition que soit explicitée la façon dont on nous aide.

J'avoue que je n'ai pas utilisé de web sémantique, toutes vos réflexions pour compléter ces remarques lapidaires seront les bienvenues. Mais a priori je maintiens que je ne vois pas comment prendre en compte le sens sans, justement, prendre en compte le sens.

C'est en tout cas me semble-t-il un vaste sujet pour l'éducation nationale, dont le but est justement de former des citoyens doués de raison. Et pas forcément de la raison du plus fort.

Traitement des « big data », données massives

Cette question préoccupe en ce moment de nombreux sociologues, philosophes, scientifiques. Les techniques de traitement des données massives modifient-elles notre façon de penser ?

On connaît les problèmes, je ne suis pas en mesure dans ce court texte de les traiter de façon autre que superficielle. Intuitivement je pense que, oui, ces techniques modifient en profondeur nos façons de penser et vont conduire à considérer comme des actions prédéterminées les comportements humains. Le glissement sera tout « naturel «  de transposer des analyses statistiques à la prédiction de comportements individuels.

Dans une première étape, on met d'énormes moyens matériels au service de la collecte de données de natures très diverses. Ces données proviennent de toutes nos activités, désormais largement numérisées : utilisation des moteurs de recherche et des sites, utilisation de toutes les ressources numériques mise à notre disposition dans notre vie quotidienne (banque, assurances, etc.) de tous les moyens par lesquels nous communiquons, de toutes les façons par lesquelles nous sommes, souvent volontairement, repérés et pistés. Tout. Rien n'échappe. De façon annexe les états pourtant « démocratiques » sont contents, ils peuvent tout surveiller. Quelques actions d'états ou d'associations, quelques initiatives des commissions européennes informatique et liberté ou du parlement européen sont entreprises pour protéger les données personnelles, mais face à l'énormité des intérêts en jeu le principe de publicité des données personnelles domine largement les pratiques.

Je ne mentionne que de façon latérale les énormes problèmes écologiques posés par ces techniques de collecte massive, en particulier l'énorme consommation d'énergie des énormes machines dédiées à au stockage et au traitement de ces énormes quantités de données.

Venons en au plus important. Une fois toutes des données collectées, des algorithmes puissants, astucieux, rédigés pour cela les explorent sans « idée préconçue », avec pour simple idée la question « que peut on tirer de tout cela ?» Et l'on peut en tirer des quantités de renseignements fort utiles, que l'on n'aurait même pas pensé à rechercher, sur les épidémies, les famines, les déplacements de population, les comportements des populations quant aux transports... La liste n'est pas fermée. L'idée est : on a un tas de trucs, on cherche, et souvent il en sort quelque chose. On n'aurait pas pu le faire autrement car les masses de données sont telles que c'était impossible sans les grosses machines et les algorithmes super.

Mais alors, quel est le problème ?

Il est double.

Les moyens nécessaires à ces traitements rendent les méthodes inaccessibles au public. Impossible d'en vérifier la pertinence, la portée. Le code et les résultats sont devenus opaque, du fait de la complexité des moyens nécessaires pour y accéder. Une partie des décisions nous concernant sera prise sans que nous puissions vérifier la pertinence des procédures mises en œuvre pour aboutir à ces décisions. Peut-être même sans que les programmeurs eux-mêmes le puissent, écrasés sous la masse de ce qu'auront produit leurs programmes.

Et puis, intellectuellement, on se heurte à la très grave question de la confusion entre concomitance et causalité, et donc de la sortie d'une méthode scientifique rationnelle. Pour prendre un exemple amusant mais vrai : en Alsace on observe plus de naissances de bébé dans les zones où il y a plus de cigognes. On est bien tenté de considérer l'un comme la conséquence de l'autre alors que... Les pratiques actuellement en œuvre dans le domaine des big data consistent à établir des corrélations grâce à d'immenses quantités de données, sans se demander le « pourquoi » : on observe que les malades du cancer qui prennent de l'aspirine et du jus d'orange vont mieux, donnons de l'aspirine et du jus d'orange aux cancéreux, sans nous demander s'il y a une raison médicale rationnelle à cette prescription. La perversion du « raisonnement » est totale : si l'on observe dans une très très grande quantité de cas une concomitance, il n'est pas gênant de la considérer comme une causalité. C'est toute la méthode d'élaboration des connaissances scientifiques qui est en cause. On se ferme aussi l'accès à une compréhension un peu large du monde, limité à des causalités indépendantes. Et l'on ouvre la porte à une énorme tentation : utiliser les analyses statistiques comme mode de prédiction des comportements individuels.

Passionnant. Le système éducatif, dans sa mission de formation de citoyens rationnels, a du pain sur la planche.

Fin du numéro hors série de [alerte] du 29 janvier 2014

Vous pouvez m'écrire à jean-michel.berard@orange.fr