Results for 'lemmatisation'

17 found
Order:
  1. La lemmatisation des sources patristiques et byzantines au service d'une description lexicale du grec ancien.Bastien Kindt - 2004 - Byzantion 74 (1):213-272.
    No categories
     
    Export citation  
     
    Bookmark  
  2. La lemmatisation des textes grecs et byzantins: une approche particulière de la langue et des auteurs.Bernard Coulie - 1996 - Byzantion 66 (1):35-54.
    Les nouvelles technologies semblent offrir la possibilité d'aborder les textes avec une grande facilité et l'illusion de pouvoir maîtriser toute la littérature. En réalité, pour utiliser toutes les potentialités des nouveaux outils informatiques, il est nécessaire d'acquérir une méthode de lecture originale des textes. L'A. illustre ce fait à partir d'une expérience acquise dans la production de concordances lemmatisées d'auteurs grecs patristiques et byzantins.
    No categories
     
    Export citation  
     
    Bookmark  
  3.  6
    Temps verbaux et linéarité du texte : recherches sur les distances dans un corpus de textes latins lemmatisés.Dominique Longrée & Xuan Luong - 2003 - Corpus 2.
    Le calcul de distance entre les textes repose souvent sur l'étude de fréquences ; ainsi, les diverses œuvres des historiens latins peuvent être caractérisées par des dénombrements de catégories grammaticales, comme, par exemple, les temps et modes verbaux ; nous proposons ici une autre méthode prenant en compte la répartition des formes verbales le long de l'axe syntagmatique et rendant compte des effets de succession, – enchaînements et ruptures –, au sein de l'ensemble ordonné que constitue le texte. Des exemples (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  4.  19
    Temps verbaux et linéarité du texte : recherches sur les distances dans un corpus de textes latins lemmatisés.Dominique Longrée & Xuan Luong - 2003 - Corpus 2.
    Le calcul de distance entre les textes repose souvent sur l'étude de fréquences ; ainsi, les diverses œuvres des historiens latins peuvent être caractérisées par des dénombrements de catégories grammaticales, comme, par exemple, les temps et modes verbaux ; nous proposons ici une autre méthode prenant en compte la répartition des formes verbales le long de l'axe syntagmatique et rendant compte des effets de succession, – enchaînements et ruptures – , au sein de l'ensemble ordonné que constitue le texte. Des (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  5.  22
    Asymétrie de la cooccurrence et contextualisation. Le rôle de la flexion casuelle dans la structuration des réseaux cooccurrentiels d'un mot-pôle en latin.Dominique Longrée & Sylvie Mellet - 2012 - Corpus 11.
    Cet article essaye d’évaluer l’impact de la lemmatisation, ou, inversement, de la flexion casuelle sur les réseaux cooccurrentiels d’un mot-pôle en latin. Conjointement, il exploite cet impact pour approfondir l’examen de l’asymétrie des relations de cooccurrence.Nos précédents articles méthodologiques, consacrés notamment à l’asymétrie de la cooccurrence, reposaient en effet sur le dénombrement des cooccurrents d’un mot-pôle considéré et décompté sous sa forme de lemme. Or, si la cooccurrence est bien la « forme minimale du contexte » [Mayaffre 2008] qui (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  6.  11
    Mesures de distance grammaticale entre les textes.Xuan Luong & Sylvie Mellet - 2003 - Corpus 2.
    Le calcul de distance entre les textes a le plus souvent été effectué à partir du dénombrement des données lexicales ; nous nous proposons ici d’abord de tester la possibilité d’appliquer l’un des calculs disponibles de distance à des paramètres grammaticaux, puis de proposer notre propre méthode à partir, non pas d’un tableau de contingences, mais d’un tableau de classement ordinal. Les textes soumis au calcul sont des textes latins empruntés à un corpus lemmatisé et étiqueté. Les différents résultats sont (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  7.  9
    Mesures de distance grammaticale entre les textes.Xuan Luong & Sylvie Mellet - 2003 - Corpus 2.
    Le calcul de distance entre les textes a le plus souvent été effectué à partir du dénombrement des données lexicales ; nous nous proposons ici d’abord de tester la possibilité d’appliquer l’un des calculs disponibles de distance à des paramètres grammaticaux, puis de proposer notre propre méthode à partir, non pas d’un tableau de contingences, mais d’un tableau de classement ordinal. Les textes soumis au calcul sont des textes latins empruntés à un corpus lemmatisé et étiqueté. Les différents résultats sont (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  8.  4
    Asymétrie de la cooccurrence et contextualisation. Le rôle de la flexion casuelle dans la structuration des réseaux cooccurrentiels d’un mot-pôle en latin.Dominique Longrée & Sylvie Mellet - 2012 - Corpus 11.
    Cet article essaye d’évaluer l’impact de la lemmatisation, ou, inversement, de la flexion casuelle sur les réseaux cooccurrentiels d’un mot-pôle en latin. Conjointement, il exploite cet impact pour approfondir l’examen de l’asymétrie des relations de cooccurrence.Nos précédents articles méthodologiques, consacrés notamment à l’asymétrie de la cooccurrence, reposaient en effet sur le dénombrement des cooccurrents d’un mot-pôle considéré et décompté sous sa forme de lemme. Or, si la cooccurrence est bien la « forme minimale du contexte » [Mayaffre 2008] qui (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  9.  28
    Sémantique interprétative et textométrie– Version abrégée.Bénédicte Pincemin - 2011 - Corpus 10:259-269.
    La textométrie propose une approche et des outils pour analyser les corpus numériques, que les chercheurs en sémantique interprétative mettent à profit depuis une quinzaine d’années. Pour éclairer ces réussites, on entreprend ici de repérer des adéquations essentielles entre la théorie linguistique de la sémantique interprétative, et les principes fondateurs de l’approche textométrique. Les connivences sont nombreuses : la place centrale des textes à toutes les étapes de l’analyse, le souci de rester au plus proche du texte et d’éviter toute (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  10. “Identifying Phrasal Connectives in Italian Using Quantitative Methods”.Edoardo Zamuner, Fabio Tamburini & Cristiana de Sanctis - 2002 - In Stefania Nuccorini (ed.), Phrases and Phraseology – Data and Descriptions. Peter Lang Verlag.
    In recent decades, the analysis of phraseology has made use of the exploration of large corpora as a source of quantitative information about language. This paper intends to present the main lines of work in progress based on this empirical approach to linguistic analysis. In particular, we focus our attention on some problems relating to the morpho-syntactic annotation of corpora. The CORIS/CODIS corpus of contemporary written Italian, developed at CILTA – University of Bologna (Rossini Favretti 2000; Rossini Favretti, Tamburini, De (...)
    Direct download  
     
    Export citation  
     
    Bookmark  
  11.  9
    Sprachwissenschaftliche Erschließungsmethoden für digitale Editionen mittelhochdeutscher Texte.Michael Stolz & Christian Griesinger - 2019 - Das Mittelalter 24 (1):112-128.
    This paper sheds light on the possibilities and perspectives of linking digital editions of Medieval German texts to each other and to other digital resources. Furthermore, it discusses some of the internal and technical conditions necessary to render this linkage meaningful, like lemmatisation, part-of-speech-tagging, and using standardised mark-up languages. Finally, the sustainability and reusability of digital editions are considered. While in the past, editions of medieval texts were conceived as rather isolated scholarly works of individual editors, nowadays the collaboration (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  12.  2
    An Application of Authorship Attribution by Intertextual Distance in English.Thomas Merriam - 2003 - Corpus 2.
    Une application d’attribution d’auteur au moyen de la distance intertextuelle en anglais Le calcul de distance intertextuelle que C. et D. Labbé appliquent aux textes français peut être utilisé pour différencier les œuvres d’au moins deux auteurs dramatiques contemporains de l’époque élisabéthaine, William Shakespeare et Thomas Middleton. Bien que les 46 textes sous étude, transcrits avec une orthographe moderne, ne soient pas lemmatisés et que seuls des échantillons de textes de même longueur aient été utilisés, les indices de distance intertextuelle (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  13.  10
    An Application of Authorship Attribution by Intertextual Distance in English.Thomas Merriam - 2003 - Corpus 2.
    Une application d’attribution d’auteur au moyen de la distance intertextuelle en anglais Le calcul de distance intertextuelle que C. et D. Labbé appliquent aux textes français peut être utilisé pour différencier les œuvres d’au moins deux auteurs dramatiques contemporains de l’époque élisabéthaine, William Shakespeare et Thomas Middleton. Bien que les 46 textes sous étude, transcrits avec une orthographe moderne, ne soient pas lemmatisés et que seuls des échantillons de textes de même longueur aient été utilisés, les indices de distance intertextuelle (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  14.  6
    Annotation de textes d’états de langue anciens : pour le redéploiement de l’existant.Adam Kraif Renwick - 2024 - Corpus 25.
    Dans le cadre de la construction du corpus PhraseoRoChe, un corpus diachronique rassemblant des romans de chevalerie du 13e au 17e siècle, cet article s’intéresse aux performances de différents analyseurs (étiqueteurs, lemmatiseurs, parseurs en dépendances) entrainés sur des états de langue connexes allant de l’ancien français au moyen français et au français moderne. Nous étudions ainsi la possibilité d’étendre ces analyseurs au-delà des états de langues précis sur lesquels ils ont été entrainés, en s’appuyant notamment sur les divergences entre analyseurs (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  15.  8
    Peut-on mesurer la distance entre deux textes ?Étienne Brunet - 2003 - Corpus 2.
    Le présent exposé tente d’explorer et de comparer les méthodes qu’on a proposées jusqu’ici pour mesurer la distance entre deux textes. Les formules sont diverses, et s’appliquent tantôt à la fréquence, tantôt à la présence / absence. Et l’objet mesuré varie grandement (graphies, n‑grammes, lemmes, classes de fréquence, codes grammaticaux, structures syntaxiques ou sémantiques). L’expérience montre pourtant que la convergence est au rendez-vous.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  16. Peut-on mesurer la distance entre deux textes?Étienne Brunet - 2003 - Corpus 2.
    Le présent exposé tente d’explorer et de comparer les méthodes qu’on a proposées jusqu’ici pour mesurer la distance entre deux textes. Les formules sont diverses, et s’appliquent tantôt à la fréquence, tantôt à la présence / absence. Et l’objet mesuré varie grandement (graphies, n‑grammes, lemmes, classes de fréquence, codes grammaticaux, structures syntaxiques ou sémantiques). L’expérience montre pourtant que la convergence est au rendez-vous.
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  17.  6
    Sémantique interprétative et textométrie– Version abrégée1.Bénédicte Pincemin - 2011 - Corpus 10:259-269.
    La textométrie propose une approche et des outils pour analyser les corpus numériques, que les chercheurs en sémantique interprétative mettent à profit depuis une quinzaine d’années. Pour éclairer ces réussites, on entreprend ici de repérer des adéquations essentielles entre la théorie linguistique de la sémantique interprétative, et les principes fondateurs de l’approche textométrique. Les connivences sont nombreuses : la place centrale des textes à toutes les étapes de l’analyse, le souci de rester au plus proche du texte et d’éviter toute (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark