Abstract
La notion de petit corpus nécessite une réflexion épistémologique pour se situer dans le paysage des sciences du langage. La taille du corpus ne pouvant suffire pour départager les petits corpus des grands corpus, la ligne de partage se situe au niveau de la représentativité et des objectifs de recherche. Le petit corpus est constitué en vue d’un objectif de recherche mené sur un domaine précis de la langue et du discours pour tenir compte des influences du type de discours et du genre sur les phénomènes linguistiques étudiés. Le petit corpus doit donc rendre compte de ce champ d’investigation particulier. La spécialisation du corpus lui confère donc sa représentativité. Pour aboutir à cette spécialisation, il est nécessaire d’établir un corpus homogène concernant les paramètres textuels, (discours, type de texte, genre, etc.). Par ailleurs, le petit corpus rend possible un retour au contexte linguistique et situationnel : une connaissance approfondie des textes favorise l’interprétation des données. Afin d’illustrer ces propos sur les petits corpus, un corpus construit dans le cadre d’une recherche menée sur la synonymie selon une approche onomasiologique et syntagmatique est présenté. Au-delà de sa petite taille, ce corpus tire sa spécialisation de son homogénéité : les paramètres textuels ont été neutralisés, puisque les textes du corpus appartiennent tous au même discours, au même type de texte et au même genre. La recherche onomasiologique suppose d’ajouter un paramètre thématique lors de la constitution du corpus : les textes choisis doivent manifester de façon saillante la même thématique. Si les paramètres textuels semblent les plus évidents pour spécialiser un corpus, d’autres paramètres inhérents à l’objectif de recherche interviennent.