Introduction au langage XML

Analyse approfondie d'une phrase (catégories / fonctions-propriétés)

Analyse approfondie d'une phrase (catégorie / fonctions-propriétés)

Nous avons vu comment analyser une phrase en syntagmes et « mots » catégorisés. Nous allons maintenant approfondir cette analyse à l'aide des « fonctions ».

Reprenons la phrase que nous avons analysée

La phrase réprésentée en arbre

Remarque. Nous avons supprimé les indices.

ComplémentUn peu de vocabulaire

Dès que l'on une arborescence, on a :

Noeud dominant-dominé
  • on appelle le nœud dominant « nœud-père » et les nœuds dominés « nœuds-fils » ;

  • un nœud dominant peut être binaire (2 nœud dominés), ternaire (3 nœuds dominés), etc. ;

  • le nœud dominant qui n'est pas dominé par d'autre nœud (1er nœud) s'appelle « racine de l'arborescence ».

Nous avons choisi les représentations syntagmatiques. Or il existe, en syntaxe, deux types principaux de représentations :

  • les représentations syntaxiques issues de la grammaire en constituance (grammaire distributionnelle) et développées par Noam Chomsky[1] et la grammaire générative ; on les appelle « représentations syntagmatiques » ;

  • les représentations syntaxiques issues des stemmas de Tesnière[2] et développées par Igor Mel'čuk[3] ; on les appelle « représentations en dépendance »

Les représentations en dépendance

  • le verbe est la racine de l'arborescence ;

  • lorsque le verbe est la racine de l'arbre, il domine les « actants », c'est-à-dire les noms sujet et objet, et les circonstants ;

  • les noms dominent les déterminants et les adjectifs, etc.

Exemple d'arborescence dépendancielle simple

Les représentations syntagmatiques en syntaxe, actuellement, sont plutôt du type

Notre analyse a défini, dans ce cas précis, trois niveaux de catégorisation :

– des catégories pour les « mots » de la phrase (« le », « petit », « garçon », « lit », etc.) ; ces catégories étaient « déterminant » (DET), « nom » (N), etc.) ;

– des catégories pour les syntagmes de la phrase (« petit garçon », « le petit garçon », « lit un livre », etc.) ; ces catégories étaient « syntagme nominal partiel » (NP'), « syntagme nominal » (NP), « syntagme verbal » (VP) ;

– une catégorie pour l'unité globale (« le petit garçon lit un livre ») ; cette catégorie était « phrase » (S).

_______________________________

Attention

Les notations employées correspondent à une norme internationale

  • S = Sentence (Phrase)

  • NP = Noun phrase (Syntagme nominal)

  • VP = Verb phrase ( Syntagme verbal)

La représentation que nous avons choisie est syntagmatique (donc non dépendancielle) et de type « théorie standard de la grammaire générative » (et non « théorie minimaliste »).

Pourquoi ?

Parce que cette structuration de la phrase est celle qui convient le mieux à la structuration en fichier XML. Notons aussi que c'est la structuration syntaxique la plus répandue actuellement.

Fondamental

MAIS...

outre les catégories des composants de la phrase analysée, on peut définir des « fonctions » :

– entre les mots,

– entre les syntagmes.

Ainsi le mot « garçon » est-il sujet de « lit » et le mot « livre » complément d'objet de « lit » ; mais aussi le syntagme « le petit garçon » est-il sujet du verbe « lit » et le syntagme « un livre » est-il complément d'objet du verbe « lit ».

Ceci appelle deux remarques :

Remarque 1 : il ne faut pas oublier « (sujet/objet) de... »

Prenons l’analyse grammaticale scolaire suivante : soit la phrase « le chat boit du lait », analyser « chat » chat : nom commun, masc. sing., sujet de « boit » Quel est le rôle de chaque rubrique ?– nom commun : catégorise le mot « chat »– masc. sing. : donne des indications syntaxiques et orthographiques– sujet de « boit » : donne la fonction de « chat »Certains collégiens donnent « sujet » pour fonction de « chat ». Cela est FAUX, parce-que "chat" peut avoir d'autres fonctions. Or, les enseignants, lassés, cessent de corriger cette erreur.

LA FONCTION EST RELATIVE : LA FONCTION NOTE UNE RELATION.

Une relation nécessite :

– un point de départ [chat]

– un point d'arrivée [boit]

– une dénomination [sujet]

Nous pouvons maintenant associer les mots entre eux en donnant leur fonction, la relation que chaque mot entretient avec un autre mot.

Fonction des mots dans la phrase

Fonction des mots dans la phrase

On remarquera que tous les mots ont une fonction, sauf le verbe. Pourquoi ? parce que le verbe n'est qu'un point d'arrivée, jamais un point de départ.

Associons maintenant fonctions (relations) et catégories :

Relations-Fonctions

Nous voyons bien ce qui distingue catégorie et fonction : la catégorie ne concerne que l'objet catégorisé ; la fonction met en relation.

Remarque 2 : la fonction « sujet » est une fonction complexe

Nous avons vu deux analyses pour le sujet de « lit » dans

Le petit garçon lit un livre

  • d'une part, « garçon » sujet de « lit »

  • d'autre part, « le petit garçon » sujet de « lit »

Les deux analyses sont correctes et l'on peut

– soit en privilégier une(*),

– soit accepter les deux.

--------------------------------

(*) La grammaire traditionnelle privilégie la première analyse, J.-C. Milner (Introduction à une science du langage) la seconde.

Où placer les fonctions sur un arbre ?

Arborescence générative 2

Remarque. Nous avons supprimé les deux « boîtes » qui distinguaient les opérations. C'est pourquoi les branches entre les catégories primaires et le lexique sont en pointillé.

Commençons par la fonction « objet de »

Fonctions Relation objet

1. Nous avons noté les fonctions sur les branches de l'arbre parce qu'elles relient les composants.

2. La fonction « objet » est notée deux fois, une fois pour le syntagme « un livre », une fois pour le mot « livre ».

Généralisons à l'arborescence :

Fonctions relations globales

Comparons les deux schémas :

Fonctions_Relations_deux_schemas

Dans l'arborescence :

– les catégories sont des nœuds de l'arborescence (intermédiaires pour les syntagmes, terminaux pour les mots) ;

– les fonctions peuvent migrer (ou se propager) de branche en branche (des mots aux syntagmes).

L'arborescence favorise l'attribution de fonctions aux syntagmes.

Dans la représentation linéaire :

– les catégories sont associées aux mots (il faudrait des parenthèses pour les associer aux syntagmes) ;

– les fonctions portent sur les mots (il faudrait des parenthèses pour les associer aux syntagmes).

La représentation linéaire favorise l'attribution de fonctions aux mots.

N.B. : les deux analyses restent possibles dans les deux cas.

Résumons

Les catégories sont associées à des syntagmes et à des mots. Ces catégories correspondront aux balises du langage XML. Les fonctions relient les mots et les syntagmes les uns aux autres.

- Elles ne peuvent donc donner lieu à des balises.

- Elles constituent des propriétés : le syntagme « le petit garçon » est sujet de « lit » le syntagme « le petit garçon » aura la propriété « être sujet de lit ».

En langage XML, les propriétés des éléments catégorisés (ou balisés) s'appelleront des « attributs ».

Pour simplifier, nous n'associerons de fonction qu'aux syntagmes sujet et objet.

Et maintenant, transformons l'arborescence :

fonctions sujet objet

Enfin, voyons la représentation de la phrase dans le fichier XML indenté :

Fichier XML indenté
  1. Arborescence "générative" selon N. Chomsky

    La grammaire générative et transformationnelle est une théorie syntaxique s'inscrivant dans le courant de la linguistique générative. Majoritairement présente en Amérique du Nord, elle s'est développée depuis 1957 sous l'impulsion de Noam Chomsky. Selon cette théorie, la phrase peut être représentée non seulement du point de vue de ses constituants, mais aussi sous une forme arborescente qui rend compte de la dépendance des constituants les uns par rapport aux autres.

  2. Tesnière - les stemmas

    Lucien Tesnière (1893-1954) est un linguiste français. Dans ses "Eléments de syntaxe structurale", (1959), il propose de représenter les phrases par une figure ayant la forme d'un arbre, appelé stemma

    Le stemma sert à visualiser des relations verticales et horizontales au sein des constructions syntaxiques.

  3. Igor Mel'čuk

    Igor Mel'čuk est un professeur de linguistique à l'Université de Montréal. Il reprend le modèle dépendanciel de Tesnière en le transformant et en faisant un component of a global model of human linguistic behavior.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)