Le numérique appliqué aux sciences historiques (histoire, histoire de l’art, littérature, archéologie, musicologie...) occupe toujours plus le devant de la scène. Mais en quoi les humanités numériques consistent-elles ?
Béatrice Joyeux-Prunel Les humanités numériques permettent de transformer des objets physiques et concrets en objets numériques – en recopiant des textes manuscrits ou dactylographiés, en numérisant des images... Les chercheurs et les chercheuses manipulent ces objets avec des techniques informatiques avancées ; le plus souvent, ils les traitent en quantité, afin de comprendre d’un point de vue statistique les logiques historiques, spatiales ou encore sociales qui guident ces objets. Ces compétences nous permettent de mieux comprendre le passé et la culture ; mais elles nous donnent aussi une perspective exceptionnelle sur la révolution numérique actuelle. Nous pouvons par exemple étudier la nouvelle culture des réseaux sociaux, l’art contemporain numérique, les NFTs, etc. Nous sommes en mesure de poser un discours sur le numérique comme sujet à part entière et non plus comme simple méthode. Aujourd’hui, ce discours semble confisqué par la sociologie, l’économie, l’informatique. Nous savons aussi utiliser l’intelligence artificielle dans nos projets de recherche, tels les projets FoNDUE ou Visual Contagions à l’UNIGE. Notre regard sur la révolution numérique est d’autant plus pertinent que nous sommes formés à l’interprétation des textes et des idées.
Simon Gabay Les humanités numériques sont construites sur un double mouvement. Le premier est technique : il faut transformer les objets du réel en objets machine actionable, c’est-à-dire en données numériques exploitables par un ordinateur. Rendre machine actionable un manuscrit ancien nécessite d’en récupérer les reproductions photographiques, d’analyser leur structure, de transcrire le texte ou de classer les images. Une donnée peut être une lettre, une phrase, un pixel, une image ou une collection d’images. Elle se retrouve stockée sous un format numérique dont la nature dépend de son usage final. Dans un second temps, et grâce à la machine qui les manipule directement, je peux en analyser de très grandes quantités. Observer, comparer et compter les données permet ainsi de poser de nouvelles questions, dont l’une des premières est : que se passe-t-il hors du canon ? Jusqu’à présent, en études littéraires, l’intérêt s’est beaucoup porté sur les mêmes livres, les mêmes poèmes, les mêmes auteurs – Madame de La Fayette, Victor Hugo ou Marcel Proust. Mais qui s’intéresse à des écrivains de Limoges ou des autrices de Neuchâtel ? Pourtant, eux et elles aussi ont fait la littérature !
Nicola Carboni Rendre un objet machine actionable n’est pas une simple transformation. Nous devons contraindre le réel pour remplir des unités matérielles computationnelles. Il s’agit d’un processus de réduction d’un sujet ou d’un document en unités sémantiques analysables qui doivent pouvoir s’intégrer dans une structure matérielle numérique – soit des cellules dans un tableur informatique, soit la structure d’une base de données. Et pourquoi fait-on cela ? Pour étudier la multitude ! Souvent, nous employons le numérique pour examiner un seul objet, mais le numérique est surtout utile pour comprendre la multitude de dimensions qui composent un objet unique ainsi que la multitude d’une collection d’objets, par exemple leurs interconnexions, leurs similitudes et leurs différences. L’étude de la multitude peut nous aider à élargir l’horizon de la discipline, en apportant une perspective différente sur notre histoire et notre culture.
La puissance de calcul de la machine permet donc de remplir des tâches qui ne seraient pas possibles humainement… Mais quel est le quotidien d’un chercheur ou d’une chercheuse ?
BJP En fait, 80% de notre travail consiste à nettoyer des données, avant d’en faire l’analyse : préparer, nettoyer, encoder, compléter, enrichir, reformater… Il faut aussi adapter les données à la question de recherche, tout en faisant en sorte de ne pas trop déformer nos sources. Vient ensuite l’observation des données sur un écran : par exemple sur une liste d’œuvres d’art, on compte celles réalisées par des femmes, le nombre d’artistes originaires d’Allemagne, etc. Ces simples actions permettent d’ouvrir de premières perspectives, que l’on croise avec d’autres sources prises à d’autres échelles, avant de revenir aux analyses computationnelles. Ultimement, l’interprétation se fait sans se contenter des approches informatiques. Nous sommes des spécialistes des sciences humaines, un domaine dans lequel la réflexion et l’interprétation sont essentielles. Il faut préciser que nous partageons nos lignes de code et nos données avec la communauté scientifique. C’est l’appel de la science ouverte, l’open access.
NC Nous réfléchissons aussi à la nature de nos outils. Par exemple, certains codes et logiciels ont été conçus pour l’économie, mais nous les appliquons à nos données historiques car ils ont la puissance nécessaire pour manipuler de grandes masses de données. Ils fonctionnent, mais il faut en connaître les limites : il peut arriver qu’ils ne comprennent pas les dates avant 1680, car les économistes n’ont pas souvent besoin d’analyser ces périodes !
SG Ce problème n’en sera sans doute bientôt plus un, car l’informatique évolue très vite. La magie de notre discipline est qu’avec le temps, certains problèmes se résolvent tout seuls ! Concrètement, la recherche consiste également à un important travail de veille. Il faut pouvoir s’adapter rapidement à la nouveauté. L’informatique implique aussi un changement de psychologie : je dois accepter de voir subsister des imperfections et de ne jamais être capable de voir toutes ces données, car elles sont impossibles à vérifier humainement tant elles sont nombreuses. Cependant, je ne suis pas aveugle ; je teste constamment ce que je fais au moyen de métriques statistiques, la seule façon qu’il me reste de garder un peu de contrôle. Cela nécessite un certain lâcher-prise.
Y a-t-il des résistances face à l’utilisation du numérique ?
BJP Oui, depuis longtemps… Cela fait partie du mythe qui oppose la culture scientifique à la culture littéraire. Je peux parler de l’histoire de l’art : au début des années 2000, j’ai vécu une double levée de boucliers contre cette manière de parler des trajectoires des artistes et des œuvres. Il s’agissait d’une saine résistance à la violence symbolique du chiffre – ce n’est pas parce qu’on nous assène un chiffre qu’il faut le croire –, mais aussi d’une peur de voir le mythe de l’art s’effondrer. En effet, la volonté d’ordonner la multitude, et avec elle l’approche quantitativiste, pousse à un prisme interprétatif socio-économique qui dérange l’histoire de l’art. La discipline s’est construite sur une idée de l’autonomie de l’art par rapport au politique, au religieux, à l’économie… Ainsi, une exposition monographique ne souligne pas qu’un artiste est vénal ou qu’il doit sa réussite à ses relations. Mais, dès lors que l’on introduit du quantitatif, de la multitude, on se rend compte de la similitude dans les trajectoires de ceux qui ont réussi – en passant par le bon atelier ou la bonne galerie, l’artiste finit le plus souvent dans un grand musée. Le champ de l’art n’est aucunement autonome de logiques commerciales ou de réseaux d’amitiés. Et montrer cela peut heurter les valeurs de l’histoire de l’art traditionnelle.
Gabriella Lini Une approche computationnelle en histoire de l’art pose un défi de taille. On consacre plus de temps à rendre compte de ses données et de son corpus et à expliquer sa méthode pour justifier de la pertinence de ses résultats. Cette problématique est moins présente dans les approches traditionnelles.
SG En études littéraires, le rapport au numérique est différent ; manipuler des données textuelles est désormais assez courant. On le voit tous les jours avec des outils comme Word ou Google. Les linguistes ont été des pionniers : ils ont très rapidement su tirer parti de la démocratisation de l’informatique, bien avant l’arrivée d’Internet. Ils travaillent avec des données informatisées et des corpus depuis des décennies. Nous avons plus de quarante ans de pratique et les standards ou les méthodes ont, dans l’ensemble, peu changé. C’est grâce à cette longue histoire que des outils comme Deepl ou ChatGPT existent.
BJP En étudiant de grandes masses de données, nous portons atteinte à un canon, à un système de valeurs qui est fondé sur un culte de la Littérature ou de l’Art. On a tendance à oublier que ce système repose sur une structure grammaticale, sociale, économique, anthropologique… et pas uniquement sur des grandes œuvres. Nous sommes parfois pris pour des déboulonneurs de statues… mais nous contribuons aussi à les mettre en lumière d’une autre manière en ouvrant le canon et en faisant de nouvelles découvertes.