Small corpora for a big database on contemporary oral English: what is at stake in the light of the PAC program?

Corpus 18 (2018)
  Copy   BIBTEX

Abstract

Le présent article prend pour point de départ de sa réflexion sur les enjeux épistémologiques et méthodologiques des petits corpus un constat simple, à savoir que ceux-ci ont survécu à l’heure où l’essor de la linguistique de corpus et le développement du big data ont multiplié les ressources. Cette survie est, selon nous, la preuve d’une nécessité à la fois matérielle et logistique et d’une pertinence scientifique des petits corpus que nous explorons sous l’angle particulier de la langue orale et du domaine spécifique de la phonologie. Nous montrons en quoi cette discipline entretient un rapport unique à l’objet langue et donc privilégié aux corpus et repensons la validité des corpus non pas en termes de taille, mais en termes de finalité. Nous défendons alors la méthodologie et les ambitions du programme PAC dont la base de données sur l’anglais oral contemporain repose exclusivement sur de petits corpus spécialisés constitués dans les différentes aires géographiques anglophones. Nous démontrons non seulement la pertinence individuelle de ces petits corpus pour l’étude quantitative et qualitative de phénomènes précis, comme le nivellement de la variété mancunienne dans le nord de l’Angleterre ; mais également l’apport concret de la comparabilité et de la jonction possible des analyses faites à partir de ces petits corpus pour la modélisation théorique des phénomènes de rhoticité et de r de sandhi dans les variétés d’anglais parlées à travers le monde. Ainsi, nous illustrons la manière dont les résultats obtenus grâce à l’étude en profondeur des petits corpus PAC permettent de penser la dynamique des systèmes de l’anglais ainsi que le poids sociolinguistique des identités, notamment nord-sud, dans la description et la compréhension de leurs caractéristiques phonético-phonologiques. Aussi, en défendant les petits corpus, nous défendons en creux la phonologie de corpus, et nous remettons en cause la supériorité automatique des grands corpus pour ce qui est de l’analyse en profondeur de la langue orale et de l’évolution des variétés d’anglais parlées à travers le monde.

Links

PhilArchive



    Upload a copy of this work     Papers currently archived: 91,322

External links

Setup an account with your affiliations in order to access resources via your University's proxy server

Through your library

Similar books and articles

Les dérivés de noms propres dans le TLFi : quelles bases pour quels sens?Sarah Leroy - 2005 - Corela. Cognition, Représentation, Langage 1 (HS).

Analytics

Added to PP
2020-10-09

Downloads
10 (#1,160,791)

6 months
7 (#425,192)

Historical graph of downloads
How can I increase my downloads?

Citations of this work

No citations found.

Add more citations