[retour à un affichage normal]

Soutenance de thèse de P. Rebollar + résumés + propos liminaire (14/12/2023)

La soutenance de la thèse de doctorat de Patrick Rebollar, intitulée La fortune des mazarinades : de la numérisation d’une collection à l’exploitation scientifique d’un corpus multimédia en ligne, dirigée par Michel Bernard (prof. Sorbonne Nouvelle), aura lieu :

  • le 14 décembre 2023, de 9h à 12h, à la Maison de la Recherche de la Sorbonne Nouvelle, Salle du conseil, 4 rue des Irlandais, 75005 Paris (il est aussi possible d’y assister en visioconférence).
  • Le jury est composé de :
    • Henri Béhar (Sorbonne Nouvelle, prof. émérite),
    • Alexandre Gefen (Sorbonne Nouvelle, dir. de recherche),
    • Stéphane Haffemayer (U. Rouen-Normandie, professeur),
    • Pascal Mougin (U. Paris Cité, professeur),
    • Olivier Poncet (École nat. des chartes, professeur),
    • Myriam Tsimbidy (U. Bordeaux Montaigne, professeur).

*

Résumé, en français et en anglais :

Dans ce mémoire de thèse, nous présentons et analysons épistémologiquement la création et l’exploitation d’un corpus de mazarinades issu de la numérisation de la collection de l’Université de Tokyo : le Projet Mazarinades.
Nous commençons par une étude sémantique et historiographique, depuis les divers sens et définitions du mot mazarinade(s) jusqu’à la Bibliographie de Célestin Moreau et aux études des XIXe-XXIe siècles. Nous proposons une discipline nouvelle, la mazarinadologie, basée sur le postulat d’existence de la mazarinadicité comme principe essentiel et du mazarinadème comme unité minimale, parfois présente dans des œuvres qui ne sont pas des mazarinades.
Nous faisons ensuite l’historique critique du Projet Mazarinades, créé en 2010 par l’équipe des Recherches Internationales sur les Mazarinades que nous avons co-fondée. La mise en ligne de plus de 2700 libelles (plus de 7 millions de mots), disponibles en texte et en image, avec des fonctions de recherche lexicale et un catalogage complet, enrichi de commentaires et de documents historiques, contribue à faire du Projet Mazarinades une importante étape dans l’évolution des humanités numériques.
Nous détaillons comment nous avons constitué notre réseau scientifique, co-organisé des colloques auxquels nous avons participé de 2013 à 2023, incitant les chercheurs à recourir au corpus en ligne et promouvant une recherche pluridisciplinaire du fait de la nature complexe des mazarinades. L’étude des méthodologies de fouille lexicale et de mise en relation avec des documents historiques permet enfin d’effectuer une revue critique de nos publications puis de proposer un ensemble de sujets de recherche prêts-à-étudier.

*

In this thesis, we present and epistemologically analyze the creation and exploitation of a corpus of mazarinades resulting from the digitization of the collection of the University of Tokyo: the Mazarinades Project.
We begin with a semantic and historiographic study, from the various meanings and definitions of the word
mazarinade(s) to the Bibliography of Célestin Moreau and studies of the 19th-21st centuries. We propose a new discipline, mazarinadology, based on the postulate of the existence of mazarinadicity as an essential principle and of mazarinademe as a minimal unity, sometimes present in works which are not mazarinades.
We then provide a critical history of the Mazarinades Project, created in 2010 by the International Mazarinades Research team (RIM) that we co-founded. The online corpus of more than 2,700 libels (more than 7 million words), available in text and image, with lexical search functions and a complete catalog, enriched with comments and historical documents, contributes to making the Mazarinades Project an important step in the evolution of digital humanities.
We detail how we formed our scientific network, co-organized conferences in which we participated from 2013 to 2023, encouraging researchers to use the online corpus and promoting multidisciplinary research due to the complex nature of mazarinades. The study of lexical mining methodologies and connection with historical documents finally allows us to carry out a critical review of our publications and then to propose a set of
ready-to-study research subjects.

Propos liminaire

Bonjour à tous et à toutes ! Je vous remercie d’être venus ou de vous être connectés pour cette soutenance à laquelle, étant au Japon, je ne peux hélas pas participer physiquement.
Je souhaiterais vous présenter brièvement ma thèse de doctorat, commencée en 2016-2017 et basée sur l’aventure de l’équipe des Recherches internationales sur les mazarinades (ou RIM), créée à Tokyo en 2008 avec Tadako Ichimaru et qui a mis en ligne dans le site du Projet Mazarinades l’intégralité des 2709 pièces de la collection de la Bibliothèque de l’Université de Tokyo.

Pour cette thèse, j’ai choisi le terrain de l’épistémologie où, me semble-t-il, se croisent, s’interrogent mutuellement et s’hybrident des recherches des domaines historique, littéraire, philologique et linguistique, recherches et domaines d’ailleurs quelque peu bouleversés par l’arrivée des différents outillages informatiques depuis les années 1970 puis de l’internet dans les années 1990.
Dans ma rédaction, j’ai donc choisi le « nous » du doctorant afin de me mettre à distance, autant que faire se pouvait, du « je » du chercheur embarqué dans ce projet.

En préambule, je voudrais recadrer, ou redessiner le contexte philologique et informatique dans lequel le Projet Mazarinades a été conçu, construit, mis en ligne puis utilisé, de 2010 à aujourd’hui. Pendant ces treize années, en effet, une collection d’imprimés du XVIIe siècle est devenue un corpus numérique interrogeable en ligne, d’une part, et, d’autre part, les humanités numériques ont beaucoup évolué, autant du point de vue technique que du point de vue sociétal et administratif, notamment dans l’université.

En 2008-2010, quand nous réfléchissions à la possibilité d’un projet de corpus numérique à partir de la collection de Tokyo que Tadako Ichimaru avait littéralement fait exister et fait connaître par sa thèse de 2006, l’expression « humanités numériques » ou « digital humanities » n’était, autour de nous, ni connue ni utilisée. Au Japon, parmi les chercheurs que nous connaissions et dans les cercles académiques que nous fréquentions, personne n’accordait aucun crédit intellectuel à un projet de numérisation, a fortiori de textes de la Fronde, période mal connue et en quelque sorte fuie par les chercheurs.
La chance que nous avons eue et qui nous a permis d’obtenir un financement du projet, d’ailleurs renouvelé trois autres fois durant cette période, est que cette collection de mazarinades était la propriété de l’université de Tokyo, acquise en 1978, et dont personne jusqu’alors n’avait essayé de tirer profit, intellectuellement parlant.

Dès le début, Tadako Ichimaru et moi avions un objectif très clair : mettre cette collection à la disposition du public, autant pour des chercheurs que pour de simples amateurs, et dans le but de créer une plateforme pour une communauté d’utilisateurs qui co-éditeraient les mazarinades de leur choix, comme ça a été le cas avec plusieurs des membres du jury d’ailleurs.
Dans ce but, la transcription humaine des textes, correcte à 99,9 %, permettait une rapide mise en ligne alors que l’océrisation générait un taux d’erreur très élevé du fait de la mauvaise définition typographique des documents dont nous disposions. L’accès en ligne par une interface relativement simple était également une priorité.
Mais ce ne pouvait être uniquement pour donner les textes à lire à partir d’une liste des pièces, ce qui est plutôt la mission d’une bibliothèque. Pour une démarche plus analytique des contenus, nous avons donc conçu un site orienté sur la recherche lexicale, à partir de textes transcrits et encodés en XML-TEI, comme des spécialistes nous l’avaient alors recommandé, et s’appuyant sur un catalogue du corpus lui-même généré par les métadonnées des fichiers des textes. Grâce à cela, on parlerait aujourd’hui de possibilité d’interopérabilité et de portabilité des mazarinades du corpus, qui seront des dimensions importantes pour l’avenir du Projet Mazarinades. Mais ce n’était pas le langage de 2010.

En revanche, nous avions indiqué deux contraintes au concepteur du site : d’une part, les textes des pièces n’étant pas encore nettoyés de leurs coquilles de transcription – il y en avait – ne devaient pas être intégralement accessibles, copiables ou téléchargeables par le public, et ce afin d’éviter la dissémination de textes fautifs contre laquelle je m’étais d’ailleurs élevé en 2005 au colloque de Cerisy consacré à l’Internet littéraire ; et d’autre part, selon le règlement de la Bibliothèque de l’université de Tokyo en vigueur en 2010-2011, nous ne pouvions pas diffuser librement les images des pages des mazarinades de sa collection.
Le concepteur informatique du site a donc dû, contre son gré, et nous le regrettions aussi, concevoir un accès public à la recherche lexicale avec des résultats sous forme d’extraits et un accès réservé aux membres inscrits qui pouvaient accéder aux textes entiers. Je parlais du règlement de la bibliothèque à l’imparfait parce qu’en 2015, l’Université de Tokyo a autorisé la photographie dans les salles de consultation et, par extension, la libre diffusion des images des pages des mazarinades. Mais en 2015-2016, notre équipe des RIM ne disposait plus d’un budget permettant de modifier en profondeur la structure du Projet Mazarinades.

Dès 2010, et parallèlement à la création du corpus en ligne et aux problèmes d’ingénierie et d’interface qui se posent pour tout site internet, notre équipe a commencé à contacter en France des universitaires et des bibliothécaires ; les uns pour les inviter à utiliser le Projet Mazarinades dans leurs recherches, les autres pour nous donner des informations sur leur(s) collection(s) de mazarinades afin de les référencer dans une page de géolocalisation internationale, d’ailleurs toujours en ligne.
Les réponses de certaines bibliothèques ont été tellement cordiales que nous avons proposé de leur rendre visite pour noter sur place les particularités de leurs fonds (et les inviter à les numériser). Avec plusieurs universités aussi des liens se sont noués, menant à des projets de colloque, depuis Bordeaux en 2013, organisé par Myriam Tsimbidy, à Rouen en 2022 en codirection avec Stéphane Haffemayer, en passant par la Mazarine et l’Arsenal en 2015, et par Tokyo en 2016. Pour qu’une minuscule équipe du Japon parvienne à de tels résultats, il fallait que les mazarinades soient sacrément attirantes !

Outre ces histoires de la collection de Tokyo et de la conception du Projet Mazarinades, ma thèse s’intéresse à deux autres objectifs que je vais maintenant évoquer : d’une part, le concept même de mazarinade, intrinsèquement lié à celui de la Fronde, et donc l’historicité de ces deux notions depuis plus de trois cents ans ; et d’autre part, les nombreuses possibilités d’utilisation ou d’exploitation du Projet Mazarinades, que ce soit pour des recherches historiques, pour de la fouille lexicale ou pour effectuer de l’édition en ligne de mazarinades, contributive, comme je l’ai déjà signalé.
Commençons par les notions et leur histoire. Sans revenir sur les développements qui m’ont amené à proposer le concept de mazarinadicité, à postuler l’existence du mazarinadème comme unité minimale[1] et à inscrire nos recherches dans le cadre de la mazarinadologie, je voudrais proposer aujourd’hui de voir l’histoire des recherches sur les mazarinades comme étant quelque peu semblable à celle des trois petits cochons.
Certes surprenante, cette parabole – qui n’est pas dans ma thèse – me paraît tout de même assez juste. En effet, dans une première période, de la Fronde jusqu’au milieu du XVIIIe siècle, l’intérêt pour les mazarinades ne résiste pas à l’opinion de Voltaire, fanatique de Louis XIV, qui les balaie du paysage comme une maison de paille ; puis les Lumières, l’encyclopédisme, les confiscations centralisées de la Révolution se concrétisent par, notamment, la création de la Société de l’Histoire de France et, un beau jour vers la fin des années 1830, par la mission de bibliographie des mazarinades confiée à Célestin Moreau, ce qui donne aux mazarinades un abri au moins solide comme une maison de bois ; par la suite et jusqu’aux années 1990, une conceptualisation plus globale et une considération plus rigoureuse d’un plus grand nombre de collections de mazarinades les installent dans une maison de briques construite en partie par les ouvrages de Marie-Noële Grand-Mesnil, de Christian Jouhaud et d’Hubert Carrier.
Ensuite, avec le Projet Mazarinades, mais aussi avec d’autres mises en ligne de mazarinades qui vont de Google Livres à Gallica, des bibliothèques de Bordeaux et d’Aix à la Mazarine, et d’autres sans doute, nous prolongeons la parabole pour proposer, selon la vision peut-être prophétique de Tadako Ichimaru, une prochaine réunion virtuelle de toutes les mazarinades, plutôt sous la forme d’une constellation de sites internet que d’une centralisation physique.
Quittant le thème de la solidité des matériaux, la quatrième maison des mazarinades n’est pas de fer ou de béton : c’est une maison immatérielle, partout accessible à la lecture et à la recherche… tant qu’il y a du réseau.
On peut aussi nommer ces étapes des changements de paradigme, comme l’histoire des sciences et l’épistémologie nous y invitent.

Passant d’une maison à l’autre, les mazarinades changent aussi de sens ou accumulent des sens sur leur nom. Dans le même temps historiographique, les études sur la Fronde, toujours plus pointues ou politiquement contradictoires, en donnent une définition plutôt floue sur les bords historiques et complexe dans ses phases et sa géographie.
Quant à moi, n’étant pas historien, je retrace comme je peux ces étapes et j’interroge ces fluctuations. In fine, je propose non pas une nouvelle définition des mazarinades mais une modélisation définitionnelle selon laquelle la mazarinadicité exprime la sensation, l’excitation, l’effroi ou l’opinion qu’avaient les contemporains de la Fronde de la fragilité du pouvoir royal durant la régence et de l’incroyable possibilité de faire tomber Mazarin par la plume burlesque, par la harangue et le triolet, et tous les genres contenus dans les mazarinades, plutôt que par l’épée, le coup d’État ou le guet-apens sanglant.
Certains diront que ces arguties définitionnelles ont peu à voir avec la mise en ligne d’un corpus de mazarinades. Bien au contraire, car dès le début il a fallu créer une structure des métadonnées et décider – par exemple – quelles métadonnées seront ajoutées aux pièces considérées comme « non mazarinades », que ce soit par Moreau, Carrier ou d’autres, alors qu’elles sont présentes dans des recueils intitulés « Mazarinades », là où quelqu’un les a mises, la plupart du temps dans un ordre voulu – ce qui est d’ailleurs devenu un nouveau sujet de recherche aujourd’hui.
L’enjeu des métadonnées bibliographiques et descriptives, c’est de permettre la sélection, le tri et la recherche lexicale sur une portion définie d’un corpus, avec pertinence et sans rien détruire ; si les métadonnées sont injustifiables, la recherche qui s’ensuit est sans valeur.

J’en arrive donc à l’exploitation du corpus du Projet Mazarinades, que ce soit dans les titres de pièces, dans les sept millions de mots du corpus entier ou dans une portion définie par un choix de métadonnées. L’équipe RIM n’ayant pas d’informaticien, d’ingénieur ou de programmeur pour créer son propre moteur de recherche lexicale, elle a recouru à une version de Philologic, le moteur de recherche développé par des chercheurs de l’Université de Chicago dans les années 1990, sans fonctions lexicométriques avancées.
De ce qui est parfois regardé comme une insuffisance, nous avons voulu faire un avantage, c’est-à-dire proposer au public une recherche d’occurrences et de co-occurrences de mots facilement compréhensible, menant à une lecture d’extraits et, par la multiplication des requêtes, invitant au tâtonnement et à la sérendipité, qu’elle soit co-textuelle ou thématique. Le chercheur combine alors distant reading et close reading, en français la « lecture à distance » et la « lecture directe ». C’est d’ailleurs ce bricolage méthodologique que j’ai explicité dans les pages de mode d’emploi du Projet Mazarinades, puis dans mes communications et articles depuis 2013, et aussi, bien évidemment, dans une part non négligeable de ma thèse.

Je voudrais conclure – et c’est aussi la conclusion de ma thèse – en soulignant que les sites internet, eux aussi, doivent évoluer ou mourir. En effet, si novateur que le Projet Mazarinades ait pu être il y a treize ans, il a été conçu avec des moyens limités et dans un langage informatique maintenant obsolète. À l’instar d’un téléphone portable des années 2000, il peut continuer à fonctionner et à rendre service tel qu’il est, mais pas tel que l’état actuel de la technologie permet à un téléphone de fonctionner.
Afin de pouvoir mieux aider les chercheurs en ajoutant d’autres fonctions de recherche, en accueillant d’autres pièces que celles de Tokyo, en proposant une meilleure lisibilité des textes et des images de pages, un nouveau site web du Projet Mazarinades devrait être créé au sein d’un consortium d’humanités numériques, français ou international, respectueux des données et des métadonnées créées depuis 2010 et auquel l’équipe des RIM contribuera volontiers.

Patrick Rebollar, à Nagoya, le 14 décembre 2023.

[1] Qui peut être présent dans deux vers de Molière (Le Tartuffe), dans un tableau de peinture (Louis XIV enfant à cheval traversant le pont du Louvre, anonyme, ca1650) ou dans une sculpture (« Louis XIV écrasant la Fronde », Gilles Guérin, 1653).

Cette entrée a été publiée dans Documents, Informations, avec comme mot(s)-clef(s) , , , . Vous pouvez la mettre en favoris avec ce permalien.


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *