Chapitre 5 : L'analyse en constituants immédiats
L’analyse en constituants immédiats est une extension de l’analyse distributionnelle. Le distributionnalisme est une théorie générale du langage développée par Leonard Bloomfield et Z. Harris. Cette théorie a très largement dominé la linguistique américaine jusqu’à 1950. Elle est l'un des fondements de la grammaire générative et a beaucoup influencé les diverses méthodes d'apprentissage des langues.
1. L’analyse distributionnelle
L'analyse distributionnelle consiste à définir l'environnement d'une unité du discours. L’analyse distributionnelle permet de constituer des classes distributionnelles /Pantalon/, /cheval/, /voiture/ sont commutables dans un grand nombre de contextes, on les regroupe dans la même classe paradigmatique : celle des noms. Tout élément partageant la même distribution et entretenant un rapport de substituabilité est regroupé dans une classe de mots. Le mot chien, dans la phrase le chien mange un os, se caractérise par l’environnement le (déterminant) et mange (verbe). Les unités chat, ogre, etc.., commutent dans ce contexte, elles appartiennent à la même classe de mot. Joëlle Gardes-Tamine dresse le tableau de concordance entre les catégories de mots isolées par la grammaire traditionnelle et celle retenue par le linguistique distributionnelle :
Analyse traditionnelle |
Analyse distributionnelle |
articles |
déterminants articles |
adjectifs démonstratifs |
déterminantsdémonstratifs |
adjectifs possessifs |
déterminants possessifs |
adjectifs numéraux cardinaux |
déterminants cardinaux |
adjectifs indéfinis |
déterminantsindéfinis adjectifs |
adjectifs qualificatifs |
adjectifs |
adjectifs numéraux ordinaux |
adjectifs |
2. L’analyse en constituants immédiats
Dans l’analyse en constituants immédiats on décompose les énoncés du corpus. Les segments issus du découpage sont appelés constituants immédiats. Ils sont isolés dans un premier temps par la possibilité de marquer une pause dans la phrase ou par la possibilité d’insérer d’autres éléments entre eux. Cette distribution suppose alors une hiérarchie entre les constituants immédiats : on a donc une structure distributionnelle ainsi que la possibilité de commuter un constituant avec un constituant absent du corpus, par exemple on peut remplacer noir par blanc (axe paradigmatique), et de permuter un constituant sur l'axe syntagmatique.
La représentation la plus employée est, sans aucun doute, celle de l'arbre syntaxique, communément appelé indicateur syntagmatique.
Chaque syntagme représente un groupe de constituants situés par rapport à un élément central. Le constituant étant l'élément qui entre dans la constitution d'un groupe.
2.1 Les constituants immédiats
a. Le syntagme nominal : SN
Le syntagme nominal est constitué en premier lieu d'un noyau nominal qui apparaît seul dans le cas de noms propres ou de pronoms :
SN
|
N
|
Jean
Elle
Ce noyau peut être accompagné d'un déterminant dans le cas des noms communs :
b. Le syntagme verbal: SV
Le syntagme verbal se constitue d'abord d'un noyau verbal :
V
|
mange
a fini
partira
Il peut également y avoir des expansions aux groupe verbal (SN, SP, SAdv, SA, proposition relative).
c. Le syntagme prépositionnel : SP
- la phrase :
- mais aussi du syntagme nominal ou du syntagme verbal :
- et parfois du syntagme adjectival :
- ou du syntagme adverbial :
d. Le syntagme adverbial : SAdv
Le syntagme adverbial permet une expansion :
- du verbe
- de la phrase
e. Le syntagme adjectival : SA
- expansion du syntagme nominal
- expansion du syntagme verbal
2.2 Règles de réécriture
Au lieu d'une analyse des constituants par la décomposition de chaque phrase d'un corpus, Chomsky propose des règles universelles permettant de générer un infinité de phrases à partir d'un nombre fini d'éléments :
Ph --> (SP) SN SV (SP)
SN --> (Dét) N (SP) (SA)
SN --> (SN) (SP) : complément du nom
SV --> (AUX) V (SN) (SP) (SA) (SAdv)
SP --> Prép SN
SA --> (SAdv) A (SP)
SAdv --> (SAdv) Adv
N --> Pro
Les éléments entre parenthèses sont facultatifs
2.3 Les phrases ambiguës
Les indicateurs syntagmatiques permettent la distinction entre des phrases de même structure mais sont syntaxiquement et sémantiquement différentes:
L'artiste peint la nuit
- peut signifier que l'artiste peint un tableau dont le sujet est la nuit ou qu'il peint pendant la nuit. Nous pouvons alors avoir les deux représentations suivantes :