En 1909, l’écrivain allemand Karl Lasswitz imagine une bibliothèque universelle reposant sur « une machine combinatoire » capable de générer toutes les combinaisons possibles de 40 lignes de 50 caractères. Cette collection contient non seulement toutes les œuvres qui ont existé mais aussi toutes celles qui ont été perdu ou qui restent encore à venir. Seulement, la bibliothèque reste un horizon rêvé et inaccessible. Non seulement il est impossible de s’y retrouver. Elle cont...| Sciences communes
« S’est-il passé autre chose ? » La crise sanitaire du coronavirus absorbe toute l’attention médiatique, alors que les mesures de confinement affectent la vie quotidienne de la moitié de l’humanité. C’est d’emblée un événement hors norme dans mon domaine de recherche, l’histoire des médias. Hors période de guerre, l’agenda médiatique n’est quasiment jamais bousculé à ce point. Plusieurs projets ont déjà été entrepris pour collecter « en direct » des informa...| Sciences communes
D’après Émilien Ruiz, les humanités numériques se trouvent “à la croisée des chemins”. Cette communauté transdisciplinaire a émergé depuis plus de 10 ans, soit suffisamment de temps pour que les pratiques du futur deviennent celles du présent. Ou pas… Car si les humanités numériques se sont ancrées institutionnellement, les promesses de renouveau scientifique et pédagogique restent encore à l’état de perspectives plus ou moins lointaines : « à ce stade, il me sembl...| Sciences communes
Au XIXe siècle, 40 235 éditions de roman ont été publiées en français d’après le Catalogue de la BNF, la plupart correspondant à des éditions uniques. De cette immense production, guère plus d’un centième est aujourd’hui connu et couramment étudié. Cette sélection radicale occulte d’importants développements de l’histoire culturelle. Près de la moitié des romanciers étaient des romancières de 1800 à 1830 : leurs œuvres ont été totalement oubliées et sont seul...| Sciences communes
En juillet 2017, la Bibliothèque Nationale de France a ouvert les données de son catalogue, créant une opportunité inédite de faire de l’analyse quantitative de longue durée en histoire culturelle. Une information essentielle est devenue soudainement accessible : la cote, soit l’identifiant où un texte est rangé physiquement dans les lieux de conservations de la BNF. Cette cote est « signifiante ». Les romans ont été rangés en Y2, les textes de droit en F et les études d’a...| Sciences communes
Parallèlement au processus général de “féminisation” des professions, il y a des activités où les femmes disparaissent. L’informatique constitue un cas emblématique : alors que de nombreux pionniers étaient des pionnières, le sex-ratio est de plus en plus déséquilibré depuis trente ans. Dans les universités américaines, le part d’étudiantes en computer science serait passée de 35% en 1984 à moins de 20% aujourd’hui. Ce phénomène de dé-féminisation n’est pas un...| Sciences communes
L’information vient d’être relayée sur Twitter (et n’a apparemment pas encore fait l’objet de publication par ailleurs) : le conseil d’État a rejeté le décret encadrant l’exception au droit d’auteur pour la fouille de texte et de données (Text & Data Mining) à des fins scientifiques. Ce rejet n’est pas définitif : la loi prévoit de toute manière un décret (“Un décret fixe les conditions dans lesquelles l’exploration des textes et des données est mise en œuvre...| Sciences communes
Au terme de 20 ans de programmes de numérisation, les bibliothèques numériques atteignent des dimensions colossales : il y a 4 millions de documents en libre accès sur Gallica et 5 millions sur son équivalent américain, Hathi Trust. Et pourtant “colossal” ne veut pas dire “représentatif”. Certains référendums en ligne illustrent bien cette nuance : tout en récolant parfois beaucoup plus de réponses que les sondages classiques, ils sont notoirement moins fiables. Ils mesu...| Sciences communes
[Analyse écrite à quatre mains] Le 1er février, Le Monde lançait en fanfare un outil de vérification de l’information, Decodex. Dix jours plus tard, une adresse IP du journal s’est retrouvée bloquée pendant neuf mois sur Wikipédia pour… avoir introduit de fausses informations sur l’encyclopédie libre. Le journaliste scientifique du Monde, Pierre Barthélémy, a en … Continuer la lecture de De Trump à Léophane : d’une débâcle journalistique à une victoire désinformat...| Sciences communes
Tout-le-monde en parle : chatGPT révolutionne l’enseignement, la programmation, la propagande, le marketing, la politique… Et pourtant, qui est chatGPT ? Tout d’abord deux modèles différents, souvent confondus. GPT c’est Generative Pre-trained Transformer 3, un modèle géant de prédiction de texte entraîné par OpenAI sur 500 milliards de mots. GPT-3 est non seulement capable d’écrire … Continuer la lecture de ChatGPT : comment ça marche ? →| Sciences communes