[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[DIVERS] [LANGAGE] [NR15] Loooong!
Bonjour Manuel!
> [NM] "Ceci dit, dans les recherches sur les langues auxquelles
> j'ai participé, il est devenu clair que le "fonds linguistique"
> des langues naturelles aussi bien que des langues synthétiques
> que nous avons examinées peut être décrit par une large matrice
> indicées par des catégories abstraites et dont les éléments
> sont des mots-idées ou radicaux primitifs bien plus concrets
> que lesdites catégories."
>
> [MR] Avant d'accepter ces donnés, si possible, je voudrais bien
> d'avoir une copie de cette matrice des mots-idées qui peuvent
> décrire n'importe quel concept enfermé dans un mot.
Oups!
Je vois que je n'ai pas été assez clair, sans doute parce que
j'ai ôté quelques mots en me relisant avant d'envoyer ce message
cette nuit:
> ... peut être décrit par une large matrice
> indicées par des catégories abstraites ...
Entre ces deux lignes j'ai coupé une ligne qui change un peu le
sens; il aurait fallu lire ceci:
> ... peut être décrit par une large matrice
> différente pour chaque langage, toutes ces matrices étant
> indicées par des catégories abstraites ...
En fait, nous avions produit (ou commencé à produire, selon le
cas) une matrice par langage examiné. Les matrices des langages
d'une même famille (latine, par exemple) étaient assez similaires
entre elles, les différences entre matrices augmentant avec les
différences croissantes entre langues... Cela s'explique sans
doute en partie par le fait que nous ne connaissions pas aussi
bien toutes les langues testées, en partie par le fait que le
procédé pour construire les matrices était largement ad-hoc et
fort peu systématique (en anglais nous étions partis du Oxford
Unabridged Dictionnary et du Thesaurus Roget, pour les autres je
ne me souviens plus)... Il y a sûrement d'autres raisons pour
la dissimilarité relative des matrices, possiblement des raisons
culturelles, nos n'avons pas vérifié la chose.
Pour ce qui est de t'envoyer une de ces matrices, je viens de
fouiller mes caisses d'archives et je n'ai rien trouvé qui date
d'avant 1985... Ces recherches ont eu lieu entre 1977 et 1980,
dans le cadre d'un projet de cours de langues assisté par
ordinateur. Tout avait été fait sur ordinosaure (la série CDC
Cyber), les fichiers étaient archivés sur gros rubans magnétiques
et parfois aussi sur cartes perforées... Je me souviens que
j'avais conservé des listings (sur papier accordéon de 14 pouces
de large, ligné vert et blanc), mais j'ai probablement oublié ou
jetté mes caisses d'archives de cette époque lors d'un des trois
déménagements que j'ai subis depuis...
Donc désolé, je n'ai pas de matrice à t'envoyer, il ne me reste
que mes souvenirs... :(
Le plus idiot, c'est qu'après tout ce travail sur la structure
des langages, le cours n'a pas fait usage des résultats de cette
recherche. C'est là les joies du travail académique, je suppose... :(
> J'aimerais aussi d'avoir quelques exemples de comment ça
> fonctionne. Par exemple comment on décrit "structure" avec ces
> mots-idées de façon univoque? Ou "patrimoine", ou "nuance", ou
> "raccourci"....
Je me souviens assez bien de la façon dont nous procédions, c'est
pas très rigoureux, mais c'est facile à comprendre. Prenons le
mot "structure" par exemple:
- on cherche d'abord l'étymologie du mot. Latin: "structura" du
verbe "struere, structum": lever, disposer par couches, arranger,
bâtir, construire, tramer (au figuré) et disposer (les mots) en
ordre. Ces significations n'ont guère changé depuis les romains.
Ce verbe latin vient possiblement de la racine indo-européenne
"ster" (étendre) d'où provient aussi le latin "sternere, stratum":
étendre, qui a donné p.ex.: les mots strate et consterner...
- On voit que structure est construit du radical "struct" et d'une
terminaison "-ure" désignant l'activité ou son résultat (p.ex.:
peinture, sculpture, bavure, parure...)
On a donc, selon le sens, un des 2 modificateurs "activité" ou
"résultat d'activité" qui vient modifier le radical "struct".
- Maintenant faut trouver la (ou les) place(s) du radical "struct"
dans la matrice.
- Pour ce faire, on établit (en anglais à l'aide du Thesaurus
Roget, en français à l'aide du Dictionnaire des idées suggérées
par les mots, qui équivaut à une des deux parties du Thesaurus
Roget) une liste des idées correspondant au mot structure, au
verbe structurer et aux différents mots construits autour de la
racine "struct" (p.ex.: infrastructure, déstructurer) ou dérivant
de la même racine (ici: le latin "struere, structum") (p.ex.: le
verbe détruire et le substantif destruction)
- Des idées correspondant à chacun des mots de cette famille, on
soustrait les aspects correspondant aux divers modificateurs
détectés, ce qui ne laisse qu'un petit nombre d'idées de base
correspondant à cette famille de mots, ici deux idées:
(1) "lever, bâtir, construire, ériger, dresser"
(2) "donner forme, arranger, disposer, étendre"
- Reste à établir dans quelle(s) case(s) de la matrice il faut
placer ces deux idées de base.
Pour ce faire, il faut créer la matrice, ce qui exige d'établir
(par exemple via le procédé que je viens d'exposer) pour chacune
des idées de base, la liste des radicaux qui y correspondent.
Une fois qu'on a toutes ces listes, on cherche une disposition
matricielle qui minimise les distances entre idées placées
dans une même rangée ou une même colonne, tout en maximisant
les distances entre idées placées dans des rangées ou des
colonnes différentes.
Contrainte supplémentaire: les marginales (sommes des cases
d'une même rangée ou d'une même colonne) doivent être disposées
de façon à minimiser les distances moyennes entre marginales
voisines (p.ex.: colonnes situées côte-à-côte) et maximiser les
distances moyennes entre marginales distantes (p.ex.: rangées
séparées par beaucoup d'autres rangées).
- Pour construire la matrice, nous avions utilisé une version fort
modifiée d'un logiciel d'analyse des correspondances de Jacques
Benzécri, la distance entre deux idées de base étant simplement
le plus petit nombre de radicaux (ou familles de mots: même chose,
autre désignation) qu'il faut franchir pour réunir ces deux idées.
Quelques exemples pour clarifier la notion de distances entre idées
de base:
* deux idées qui ont un radical en commun sont à la distance 1;
ici c'est le cas des idées (1) et (2) plus haut: elles partagent
le radical "struct"
* si la distance entre les idées a et b vaut 1
et la distance entre les idées b et c vaut 1
et les idées a et c n'ont aucun radical en commun
alors la distance entre les idées a et c vaut 2
* autrement dit, le chemin le plus court pour passer de l'idée a vers
l'idée c est de partir d'abord de a pour aller en b (distance 1)
puis de partir de b pour aller en c (distance 1), donc la distance
entre a et c vaudra 1 + 1 = 2
* il va de soi que pour toute paire d'idées il peut y avoir plusieurs
chemins pour passer de l'une à l'autre, auquel cas on utilise la
distance correspondant au chemin le plus court
Le résultat était une matrice dont chaque rangée était assez cohérente
(distances faibles) et chaque colonne était elle aussi assez cohérente
(même chose). Chaque case était soit vide (inutilisée), soit un
singleton (une seule idée de base), soit - rarement - une paire
d'idées extrêmement proches (assez souvent c'étaient des erreurs
de classification: des idées identiques auxquelles nous avions
attribué des codes différents).
Aux premiers essais, nous nous étions amusés à chercher pour chaque
rangée et chaque colonne une désignation décrivant le mieux possible
ce qu'il y a en commun entre toutes les cases de la rangée ou de la
colonne. Plus tard nous avons cessé d'essayer de désigner clairement
chaque rangée et chaque colonne, faute de temps.
La représentation du mot "structure" serait donc double, selon le sens:
- coordonnées de l'idée (1), mettons (A1, C2), suivies du modificateur
"résultat d'activité", mettons (M13), ce qui donne A1C2M13 signifiant
"résultat de l'activité de lever. bâtir, construire, ériger, dresser"
- coordonnées de l'idée (2), mettons (A1, C3), suivies du modificateur
"résultat d'activité", mettons (M13), ce qui donne A1C3M13 signifiant
"résultat de l'activité de donner forme, arranger, disposer, étendre"
On aurait pu remplacer les coordonnées numériques par des coordonnées
syllabiques (même chose pour les modificateurs), ce qui aurait permis
d'écrire par exemple: bakerun au lieu de A1C2M13
(p.ex.: structure d'un bâtiment)
bakérun au lieu de A1C3M13
(p.ex.: structure d'une symphonie)
Mais bon, nous n'y avions même pas pensé, ou en tous cas nous n'en avions
même pas parlé. Comme quoi, il est facile de ne pas voir la chance qui
passe... :)
Etait-ce très logique et raisonnable?
Non: trop ad-hoc et improvisé, c'était du bricolage, sans plus...
Mais cela fonctionnait! :)
Dommage qu'il ne m'en reste plus que le souvenir... :(
Ce serait un projet à re-faire, tiens, mais de façon plus systématique et
en incorporant on bon nombre de langages terrestres, plutôt qu'un seul à la
fois... Si quelqu'un a les budgets sous la main, cela vaudrait sans doute
la peine d'essayer... :)
Avec comme résultat un "langage international" de plus, mais dont la forme
serait plus systématique. :)
Amitiés,
Norman.
===========================================================
Liste de diffusion UMMO "DIVERS" (Tout ce qui n'entre pas dans les 4 autres listes).
Pour envoyer un message: soit fonction "répondre", soit
mailto:ummo.open@ummo-sciences.org
Soumis à la charte:
https://www.ummo-sciences.org/nvle_charte.htm
Archives de la liste:
http://archives.ummo-sciences.org/ml/ummo.open-AAAAMM/maillist.html ( en remplacant AAAA par l'année et MM par le N° du mois)
Pour se désinscrire :
mailto:ummo.open_request@ummo-sciences.org?subject=unsubscribe
===========================================================