Introduction au langage XML

Analyse d'une notice documentaire

Analyser des références bibliographiques et des notices documentaires

Peut-être préparez-vous un concours de documentaliste ou de bibliothécaire ; dans ce cas, ce qui suit vous semblera très simple. Si ce n'est pas le cas, vous avez sans doute dû déjà rédiger des bibliographies pour des devoirs ou des (mini-)mémoires.

Dans tous les cas, ce qui va suivre vous concerne. Les notices documentaires posent en effet de nombreuses questions intéressantes concernant la catégorisation.

Un(e) documentaliste, un(e) bibliothécaire doit savoir décrire un document (livre, article, cédérom, film, carte, etc.) pour produire une notice. Il/elle doit aussi savoir interpréter une notice produite par d'autres personnes.

Fondamental

La notice documentaire permettra d'effectuer des recherches : trouver un ouvrage (ou disque, film, carte, etc.) dont on connaît titre, auteur, etc. ; chercher des ouvrages, articles, films, photos, etc. portant sur tel sujet ; pouvoir ranger des ouvrages, disques, etc. de façon à les retrouver facilement ; etc.).

Si l'on veut que l'intercommunication entre individus fonctionne bien, il faut normaliser les descriptions.

On appellera catalogage la façon de décrire un document en utilisant des normes internationales.

Par exemple, pour un ouvrage, on donnera d'abord l'auteur, puis le titre, puis la ville d'édition, le nom de l'éditeur et l'année de publication.

Exemple

Voici une notice documentaire

Dans cette notice, on commence par le titre et les autres paramètres sont donnés à la suite.

Vous remarquerez que l'on a deux colonnes :

1. les paramètres (colonne de gauche)

2. les données ou informations (colonne de droite)

Notice documentaire

Remarque

Mais certains ouvrages et les revues sont des recueils d'articles. Le nom de l'ouvrage ou celui de la revue ne suffit pas. Il faut descendre à un niveau inférieur, celui de l'article

Exemple

Pitanine, Boris, « Diffraction de la lumière dans l'œil d'un bovin », in : Georges Debogie dir., Les trains et les vaches, Paris, Editions Delacampagne, 2016, pp. 38-40.

Flaye, Ingrid, « Comment détecter les fines mouches ? », Revue d'entomologie extrapolée, 25 : 3 (2022), pp. 5-10.

Nous obtenons ainsi de nouvelles catégories (« titre d'article », « nom de revue », « pages », etc.)

ComplémentUn peu de vocabulaire

En français, on appelle « directeur » (abréviation « dir. », cf. ci-dessus) celui / celle qui est responsable d'un ouvrage qui est un recueil d'articles et on appelle « éditeur » celui / celle qui publie le livre après l'avoir fait imprimer.

En anglais, on appelle « editor » (abréviation « ed. ») la personne responsable d'un recueil d'articles et « publisher » celui / celle qui publie le livre après l'avoir fait imprimer.

Le mot « editor » est passé en français sous la forme « éditeur scientifique » (abréviation « ed. ») :

Français

Anglais

Français (actuel)

Directeur

Editor

Editeur scientifique

Editeur

Publisher

Editeur commercial

Du fait de cette « évolution » terminologique, de plus en plus, on remplacera, en français, « dir. » par « ed. ». Reprenons l'exemple donné ci-avant.

Comparez :

Pitanine, Boris, « Diffraction de la lumière dans l'œil d'un bovin », in : Georges Debogie dir., Les trains et les vaches, Paris, Editions Delacampagne, 2016, pp. 38-40.

et :

Pitanine, Boris, « Diffraction de la lumière dans l'œil d'un bovin », in : Georges Debogie ed., Les trains et les vaches, Paris, Editions Delacampagne, 2016, pp. 38-40.

Mais les documents à cataloguer ne sont pas que des ouvrages papier. Ce peut être des disques de musique, des films, des cartes géographiques, etc.

Prenons l'exemple d'un disque :

Après la pluie, le beau temps [enr. sonore] / Optimiste Georges — München : Meteo Records ; [Paris : distr Diskgraph], 2028 — (2 h 12 min 32 s) : DVD.

Un disque est édité dans un pays et peut être distribué par un distributeur spécifique dans un autre pays. Il a une durée (alors qu'un ouvrage papier a un nombre de pages). Il peut y avoir différents supports (exemple : les anciens 33 tours en vinyle).

Alors que tous les articles de dictionnaire ont grosso modo la même structure (il y a une certaine unité de l'objet considéré), les documents à décrire à l'aide de notices documentaires seront très diversifiés.

On voit donc apparaître une nouvelle préoccupation : relier des catégories à des types de documents.

Nous retrouverons cette préoccupation lorsque nous nous intéresserons aux corpus.

SimulationDe l'analyse de l'information à la représentation XML (notice documentaire)

Nous avons vu jusqu'alors des analyses de l'information de documents divers, passons à une structuration conforme à la syntaxe de XML.

Comment fonctionne la syntaxe XML ?

  • Une balise catégorise un contenu

  • Toute balise se subdivise en deux balises

    - une balise ouvrante (initiale)

    - une balise fermante (terminale)

fonctionnant ainsi comme un couple de parenthèses

  • Une balise peut contenir d'autres balises

(exemple : <auteur><nom>Dumoulin</nom><prenom>Roger</prenom></auteur>)

Un fichier XML comporte nécessairement une balise racine qui entoure TOUT le contenu (du fichier). Dans notre exemple précédent, la balise racine est <notice>

En suivant la syntaxe XML, nous obtiendrons pour la notice "DUMOULIN, Roger, Comment obtenir un blé de qualité ? Paris, Editions du Meunier, 2043. 212p."

<notice><titre>Comment obtenir un blé de qualité ?</titre><auteur><nom>Dumoulin</nom><prenom>Roger</prenom></auteur><lieu>Paris</lieu><date>2043</date><edition>Editions du Meunier</edition><collation>212</collation><collection>Industrie agricole</collection><sujet>Agriculture</sujet><isbn>12-342354-9</isbn></notice>

Ce balisage linéaire, "frappe au kilomètre" est difficile à lire, particulièrement pour des fichiers complexes. Nous proposerons une autre représentation, toujours en XML, mais plus adaptée et plus lisible dans le cours prochain.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)