BIBLindex
  • Accueil
  • Présentation (actuel)
    Vue d’ensemble du projet Historique du projet Développements à venir (actuel) Équipe du projet Publications Crédits
  • Outils bibliques
    Textes bibliques Correspondances bibliques Crédits des textes
  • Outils patristiques
    Recherche de citations
    Corpus des recherches Auteurs patristiques Œuvres patristiques Groupes d'auteurs patristiques
    Problèmes à corriger Statistiques
  • Aide
    Directives Tutoriels
  • Contact
  • Jérôme, Noms Hébreux
    Le projet ANR Jerihna Une édition numérique Un séminaire de recherche Jerihna et BiblIndex Bibliographie
  • FR
    EN
  • Développements à venir

  • Les grands axes du travail en cours

    Le principal défi auquel BiblIndex est confronté est le suivant: trouver un équilibre entre quantitatif et qualitatif. Il faut rendre accessible dans des délais raisonnables un corpus élargi : plus le nombre de citations répertoriées sera grand, plus les champs de recherche couverts seront larges, et plus l’index permettra des analyses statistiques pertinentes et novatrices. Mais il faut aussi garantir la qualité et l’homogénéité des relevés, en élaborant des techniques de repérage très fines et cohérentes. La première exigence passe par l’intégration massive d’index scripturaires de nouvelles œuvres ; la seconde par l’analyse fine et chronophage de l’intertextualité biblique au fil de la lecture du texte patristique. Modèle de données et interfaces doivent rester compatibles avec les deux approches. Aussi cette dichotomie entre quantitatif et qualitatif est-elle au cœur de chacun des axes du travail en cours, dont le développement se fait de façon itérative, dans un va-et-vient continuel entre informaticiens et patristiciens :

    • l’élargissement du corpus, par la saisie et la vérification des références existantes, et dès que possible par l’acquisition de nouvelles données par des spécialistes des textes concernés ;
    • la création d’une large communauté par le développement d’un site de travail collaboratif ;
    • le repérage automatisé de l’intertextualité biblique dans les textes ;
    • la réflexion sur les modalités de visualisation des données ;
    • le travail directement effectué sur les textes bibliques et patristiques, et son couplage avec les références chiffrées existantes.
  • L’élargissement massif du corpus

    Steven R. Harmon a clairement pointé les insuffisances de la couverture géographique et chronologique de Biblia Patristica 1. Pour y remédier le plus rapidement possible, nous avons pris le parti, plutôt que de faire de la vérification systématique des données d’archives non publiées par le CADP un préalable à leur intégration, de les saisir comme elles étaient, en précisant à l’internaute qui les consulte qu’il s’agit de données provisoires. Parallèlement à cela, bien sûr, le minutieux travail de vérification se poursuit2 : référence après référence, il permet à une donnée en ligne de ne plus apparaître en rouge, « non vérifiée », mais en noir. Jusqu’à présent, toutes les données récupérées ont été préparées selon des directives uniformes3 : vérifiées ou non, leur homogénéité est donc assurée.

    En complément des relevés déjà accessibles en ligne évoqués plus haut, environ 600.000 références, contenues dans les 15 mètres linéaires d’archives manuscrites du CADP et repérées sur quelque 3.000 œuvres, essentiellement écrites en grec, mais aussi en latin et en syriaque, entre le ive et le xive siècle, ont été saisies numériquement entre 2011 et 2017. On peut dresser un premier aperçu du corpus constitué par ce million de données réunies : les trois premiers siècles ont été intégralement traités ; l’essentiel du ive siècle est couvert. Pour le ve s., les œuvres exégétiques de Jérôme qui manquaient encore ont été intégrées, Cyrille d’Alexandrie et Théodoret de Cyr ont été intégralement traités, ce qui est également le cas pour des auteurs plus tardifs comme Procope de Gaza, Grégoire le Grand (vie s.), Maxime le Confesseur (viie s.). À ces auteurs majeurs s’ajoutent de nombreuses chaînes exégétiques, des œuvres de Pseudo-Chrysostome, des textes liturgiques, notamment byzantins, etc.4

  • Maintenant que l’intégralité de ces archives du CADP a été exploitée – même si un gros travail de vérification reste encore à effectuer –, BiblIndex construit un programme systématique de traitement des œuvres manquantes, reprenant à son compte l’objectif d’exhaustivité des relevés de Biblia Patristica, en commençant par les ive et ve siècles. Le premier chantier, qui a démarré en août 2017, concerne les œuvres d’Augustin, très demandées par les internautes. Des directives spécifiques à BiblIndex ont été rédigées5, qui sont en grande partie compatibles avec celles du CADP.

    Un effort tout particulier est prévu pour intégrer l’immense domaine du christianisme oriental, et tout d’abord syriaque, jusqu’ici inexploré pour les citations bibliques. Le rapport à la Bible des textes syriaques est en effet très intéressant à cause de la proximité linguistique entre l’hébreu et le syriaque. Répertorier leurs citations permettra des avancées significatives pour identifier ou reconstituer l’origine des versions : pour l’Ancien Testament, les targums juifs, pour le Nouveau, d’une part le Diatessaron, et d’autre part la Vieille Syriaque, soit la curetonienne soit la sinaïtique et enfin la Peshitta du ive siècle, que l’on peut comparer à la Vulgate latine. Les dix volumes de traduction du syriaque dans la collection Sources Chrétiennes, avec leurs index bibliques, constituent une base de départ pour le travail, à élargir, en particulier avec l’œuvre d’Éphrem éditée au Corpus Scriptorum Christianorum Orientalium et qui doit être progressivement traduite dans la collection. Les sources syriaques postérieures au ve siècle sont aussi très importantes comme témoins des œuvres grecques, parfois perdues dans leur langue originale (par ex. Sévère d’Antioche et Théodore de Mopsueste)6.

    À cela s’ajouteront des ressources extérieures en cours de constitution, en particulier le relevé des citations dans les œuvres de Bernard de Clairvaux (environ 35.000 références) ; nous espérons aussi pouvoir mener à bien un partenariat avec la Faculté de Théologie de l’Université Aristote de Thessalonique7, qui a réalisé, grâce à une équipe nombreuse ayant travaillé plus de 30 ans sous la direction des professeurs S. Sakkos et P. Koutlemanis, un index scripturaire, aujourd’hui disponible sous forme numérisée, d’environ 350.000 références, qui couvre l’ensemble de la Patrologie grecque de Migne, et que son actuel responsable, le Pr. Athanasios Paparnakis, propose de rendre accessible via BiblIndex8. Un autre partenariat est en cours d’élaboration avec le projet PAVONe (Platform of the Arabic Versions of the New Testament) de l’Université de Balamand (Liban), qui recense non seulement tous les manuscrits arabes du Nouveau Testament, mais aussi les citations du Nouveau Testament présentes dans les lectionnaires et dans la littérature chrétienne – et musulmane – du premier millénaire. Par ailleurs, les index scripturaires de tous les volumes de la collection Sources Chrétiennes non encore pris en compte par le CADP seront ajoutés, en premier lieu les volumes récents dont l’index ne nécessitera qu’une révision technique. À plus long terme seront envisagées l’association avec d’autres bases de données, ouvrant à d’autres aires culturelles et religieuses: judaïsme9, textes samaritains, Islam.

    L’architecture est entièrement modélisée, une bonne partie des données est déjà prête à l’import. Les rendre accessibles en ligne au plus vite, et pouvoir ensuite ajouter facilement de nouvelles données au fur et à mesure de leur préparation, sont des objectifs absolument prioritaires pour le projet. Malheureusement, depuis des années, la faiblesse des moyens techniques mis à la disposition du projet, due à l’insuffisance des financements reçus pour ce poste de dépenses et à l’impossibilité d’obtenir des postes spécifiques du CNRS, l’interdit pour le moment. Diverses recherches de financements extérieurs sont en cours.

  • La création d’un site collaboratif et la détection automatisée de l’intertextualité

    Compte tenu de l’ampleur du travail de relevé et de vérification à accomplir pour parvenir à l’exhaustivité et à une relative homogénéité des données, il est évident que la petite dizaine de membres de l’équipe des Sources Chrétiennes est insuffisante. Deux pistes sont explorées pour accélérer le processus.

    La première est la mise en place d’une plateforme de travail collaboratif, où chaque internaute, utilisateur de BiblIndex et spécialiste d’un texte ou d’un domaine, pourrait au fil de ses requêtes participer à l’amélioration des données, en suggérant des corrections via un système de validation contrôlé. Tout chercheur préparant l’édition d’un texte pourrait également, au fil de son travail, contribuer à améliorer les relevés existants ou fournir des données nouvelles. Les maquettes de cette plateforme sont prêtes, et n’attendent elles aussi que les financements pour devenir réelles…

    La seconde est l’application aux corpus patristiques de techniques de détection semi-automatique des coïncidences entre textes. Ces outils d’aide à la recherche des citations ont vocation à intervenir en amont du travail des patristiciens et biblistes, pour fournir à ces derniers une version pré-balisée du texte à analyser.

    En 2013, un post-doctorat dans le cadre du LIRIS a été mené en ce sens par Samuel Gesche10. Un état de l’art très précis dans le domaine de la lemmatisation en langues anciennes a d’abord été établi : de nombreux travaux sont en effet en cours dans les différents instituts. BiblIndex peut ainsi s’appuyer sur des versions lemmatisées morphologiquement des textes bibliques grec et latin ; pour le syriaque, le travail sera fait en collaboration avec le projet EEP Talstra Centre for Bible and Computer (VU Amsterdam). Dans la mesure où une connaissance fine du système linguistique de chacune des langues anciennes est indispensable pour préparer les outils de lemmatisation11, le travail a été mené en collaboration étroite entre l’informaticien et les patristiciens. Un lemmatiseur spécifique au grec ancien patristique, encore à parfaire, a été préparé. Par ailleurs, sur la base d’un corpus échantillon lemmatisé [constitué du texte de Clément d’Alexandrie, Quel riche sera sauvé (SC 537) et des œuvres complètes de Philon d’Alexandrie côté patristique, du texte lemmatisé de la Septante et du Nouveau Testament Grec côté biblique], un outil de détection des citations, paramétrable, a été développé. Il n’est pour l’heure efficace que lorsque le passage patristique et le passage biblique comptent au moins un lemme commun, mais c’est déjà un bon début ! Maria Moritz (Institute of Computer Science, University of Göttingen) a repris ce travail sur le même corpus de test, augmenté par des échantillons de textes de Bernard de Clairvaux, ce qui a donné lieu à une publication en 201612. L’utilisation du logiciel TRACER, développé par Marco Büchler dans le cadre du groupe de recherche e-TRAP (electronic Text Reuse Acquisition Project) à Göttingen, permet en effet de repérer aussi un certain nombre d’allusions paraphrastiques. Il faudra encore fournir beaucoup de données d’apprentissage pour que les performances du logiciel sur les textes patristiques soient suffisantes, et nous envisageons parallèlement de compléter la construction jusqu’ici purement morphologique de nos lemmes par des regroupements en champs sémantiques, en créant de vastes dictionnaires de synonymes, multilingues ; c’est un domaine de recherche extrêmement prometteur. Les journées de recherche de l’International Workshop on Computer Aided Processing of Intertextuality in Ancient Languages, organisé à Lyon comme colloque conclusif de l’ANR BiblIndex, l’ont bien montré : elles ont rassemblé des représentants de très nombreux projets européens travaillant sur l’intertextualité dans des corpus anciens. Les actes de cette rencontre ont été élargis, pour donner naissance à un numéro spécial de la revue Journal on Data Mining and Digital Humanities (JDMDH), paru en 2017.

  • La visualisation des résultats

    Un autre chantier concerne la visualisation des citations repérées, aussi bien en amont dans les interfaces qu’utiliseront les analystes – un gros travail a déjà été mené par le LIRIS pour la visualisation en défilement parallèle de textes bibliques et patristiques – qu’en aval dans celles que consultent les internautes – formulaires d’interrogation basique du corpus, formulaires de résultats devant permettre des tris multiples13, etc. Des maquettes très précises ont été réalisées pour l’ensemble de ces interfaces, qui n’attendent plus, elles aussi, que l’argent pour financer leur implémentation.

    Plus spécifiquement, le Laboratoire d’Informatique de Grenoble (LIG) a préparé des maquettes et un prototype d’interfaces multidimensionnelles14 pour permettre des visualisations du corpus très difficiles, voire impossibles autrement, à partir de requêtes temporelles, spatiales ou spatio-temporelles. L’un des enjeux était de rendre compte des caractéristiques de l’information en termes de qualité (incertitude, incomplétude ou imprécision) et de densité, au moyen d’une sémiologie graphique et cartographique adaptée, tout en tenant compte de la diversité de profils des utilisateurs finaux. À terme, il faudra pouvoir sélectionner des dossiers bibliques, c’est-à-dire des ensembles de citations scripturaires qui fonctionnent en constellation pour une thématique, par zone géographique et pour une période donnée. La sélection des zones ou des périodes s’effectuera au moyen de requêtes visuelles (clic sur une carte ou sur un graphique temporel au moyen d’un curseur). Ces fonctionnalités pourront faire émerger des processus de répartition ou de diffusion des textes bibliques difficilement perceptibles à travers une simple interface textuelle: quel canon, quel texte, était reçu, à telle époque, à Antioche, en Afrique du Nord, etc. ?

    L’interdisciplinarité est donc au cœur du projet BiblIndex et nécessite l’intervention d’un grand nombre de spécialistes de domaines variés. Au sein de notre laboratoire de SHS HiSoMA, nous nous concentrons sur les phases du travail qui relèvent essentiellement de nos compétences, à savoir la préparation des textes bibliques et patristiques en vue des phases ultérieures de leurs visualisations.

  • 1.↑ S. R. Harmon, « A Note on the Critical Use of Instrumenta for the Retrieval of Patristic Biblical Exegesis », Journal of Early Christian Studies 11:1 (2003), p. 95-107, sp. 100 et 106.

    2.↑ Pour ne prendre qu’un exemple, il y a 43701 références trouvées chez Jean Chrysostome dans BiblIndex : ces données ont été principalement relevées sur la base du texte de la Patrologie de Migne. Entreprendre une vérification rigoureuse de ces données, en se reportant aux textes critiques plus modernes lorsqu’ils sont disponibles, représenterait environ 30.000 heures de travail.

    3.↑ J. Allenbach (dir.), Étapes, moyens et méthode d’analyse pour la constitution du Fichier microphotographique des citations de l’Écriture chez les Pères, CADP, Strasbourg 1967.

    4.↑ Une liste exhaustive est disponible sur la page « Corpus de recherche ».

    5.↑ L’essentiel du document français rédigé pour les collaborateurs a été publié en anglais dans l’article suivant: L. Mellerin, « Methodological Issues in BiblIndex, An Online Index of Biblical Quotations in Early Christian Literature », dans M. Vinzent, L. Mellerin, H.A.G. Houghton (éd.),Biblical Quotations in Patristic Texts, Studia Patristica LIV, vol. 2 (Papers presented at the Sixteenth International Conference on Patristic Studies held in Oxford 2011), Leuven-Paris-Walpole, MA 2013, p. 11-32.

    6.↑ L’article de L. Van Rompay, « Between the School and the Monk’s Cell: The Syriac Old Testament Commentary Tradition », dans B. T. H. Romeny (éd.), The Peshitta : Its Use in Literature and Liturgy. Papers Read at the Third Peshitta Symposium, Brill, Leyde 2006, p. 27-51, donne une liste des œuvres dont le traitement est prévu.

    7.↑ Voir A. Paparnakis, C. Domouchtsis, « Digital Greek Patristic Catena (DGPC). A brief Presentation », dans M. Büchler, L. Mellerin (éd.), Computer-aided Processing of Intertextuality in Ancient Languages, Journal on Data Mining and Digital Humanities, special issue, 2017.

    8.↑ 200.000 références environ ne font pas doublon avec le contenu de BiblIndex.

    9.↑ Nous avons eu connaissance d’un certain nombre d’initiatives semblables pour les textes du judaïsme de l’époque du second Temple et de la période rabbinique: à Brown University, Michael L. Satlow a traité le Talmud de Babylone. À Vienne, un projet a été mené sur le Second Temple, mais la page qui l’hébergeait ne semble plus exister. À Saint-Louis University, Matthew Thiessen a démarré en 2013 un projet de Biblia iudaica, après avoir rassemblé environ 12.000 citations du livre de la Genèse dans les textes du second Temple et de l’époque rabbinique. Par ailleurs, la base de données des textes rabbiniques de l’Université de Bar-Ilan (Responsa Project) a repéré et lemmatisé une bonne partie des citations bibliques. Le projet « The Greek Bible in Byzantine Judaism » du King’s College à Londres a pour objectif de rassembler les traces textuelles de l’usage de traductions grecques de la Bible par les juifs à l’époque byzantine et d’en fournir un corpus consultable en ligne.

    10.↑ Voir S. Gesche, E. Egyed-Zsigmond, S. Calabretto, « References and Citations in Ancient Greek Documents », 2017.

    11.↑ En particulier, la liaison des formes ou lemmes répertoriés avec les lieux et contextes de leurs occurrences; la levée des ambiguïtés lors de la lemmatisation.

    12.↑ M. Moritz, A. Wiederhold, B. Pavlek, Y. Bizzoni, M. Büchler, « Non-Literal Text Reuse in Historical Texts: An Approach to Identify Reuse Transformations and its Application to Bible Reuse », dans Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, Austin, Texas, November 1-5, 2016, p.1849–1859.

    13.↑ Le formulaire de recherche du site a été entièrement repensé pour permettre à l’utilisateur d’entrer dans le corpus par la Bible et la numérotation de son choix, et le formulaire de résultat pour qu’il puisse voir le texte biblique correspondant à sa requête et opérer tous les tris possibles dans les données obtenues, ce que le formulaire figé actuel ne permet malheureusement pas.

    14.↑ La conception et la réalisation de cette interface reposent sur l’environnement GenGHIS, générateur d’applications de visualisation de données spatio-temporelles, développé initialement pour rendre compte de l’information historique dédiée aux risques naturels. On peut y formuler des requêtes visuelles et consulter les résultats à travers plusieurs fenêtres, toutes interconnectées et synchronisées : une fenêtre cartographique est dédiée à la partie spatiale, un axe de temps représente la dimension temporelle, et une fenêtre informative (ou attributaire) visualise des détails de chaque entité informationnelle contenue dans le système d’information.

v2.0-beta Projet dirigé par Sources Chrétiennes - Copyright © 2005-2023 BIBLINDEX - CNRS