Mot Wiki Conversation Technique

Conversations techniques sur les Mots Wiki

L'objectif d'un Mot Wiki

Il paraît important de ne pas perdre de vue l'objectif d'un Mot Wiki : il s'agit de créer simplement et de façon réglementée une manière de référencer lisiblement une page du site. Mot Wiki fait référence à la page "Mot Wiki" de ce présent site dont le sujet concerne les Mots Wiki. --Charles Nepote

Le contenu réel des Mot Wiki

La définition ci-dessus est incomplète ou inexacte : "Un Mot Wiki est composé d'au minimum deux mots avec leurs premières lettres en majuscules et sans espaces". Qu'entend-on en effet par mot ? PHP est-il un mot ? Si oui, pourquoi le Mot Wiki EnPHP ne fonctionne-t-il pas ? Les chiffres, les soulignés-bas "_", la prenthèses, les crochets, etc. peuvent-ils faire partie d'un mot-wiki ?
Le créateur des Wiki, Ward Cunningham, a défini un Mot Wiki comme l'ensemble des propriétés suivantes :

  • des mots collés ensembles,
  • composés exclusivement des lettres A-Z et a-z,
  • la première lettre de chaque mot étant en majuscule,
  • chaque majuscule étant suivie au minimum d'une lettre minuscule.

J'ai tiré ces règles de deux sources distinctes :

/[A-Z][a-z]+([A-Z][a-z]+)+/

Il existe sur le wiki originel de nombreux débats sur des règles alternatives, mais ils sont très décousus et aucun consensus ne semble émerger.
Pour tenter de démêler un peu tout ça j'ai commencé par créer des Cas De Test De Mots Wiki que chacun pourra copier/coller dans son wiki favori afin de vérifier ce qui est supporté de ce qui ne l'est pas.

Accentuation

Les Wikis francophones évolués semblent généralement adopter la possibilité de Mot Wiki accentués comme Web Sémantique. Cela paraît être de bon sens puisque les accents sont des marques orthographiques qui affectent le sens : comment sinon faire la différence entre Un Homme Tue? et Un Homme Tué? ?
Les Mot Wiki contenant des caractères accentués donnent des URL partiellement codées ; par exemple Web Sémantique donne :
http://wiki.crao.net/index.php/WebS%E9mantique
ou bien http://fr.wikipedia.org/wiki/Wikip%e9dia%3AR%e8gles_de_nommage
Le "é" semble codé "%E9" dans l'URL.
Ailleurs, sur un wiki utilisant Moin Moin, on trouve par exemple :
http://www.publishtogether.com/pompeurs/ChangementsR_e9cents
Le "é" semble ici codé "_e9".

Pourquoi ces différences ?
Hors la lisibilité dégradée, quels sont les incidences de l'emploi de telles URL ?
Comment sont-elles implémentées dans les différents moteurs de Wiki ?
-- Charles Nepote

Le bon codage pour "é" est "%E9". C'est en fait l'encodage normalisé dans l'écriture des URI des caractères "hauts" (accents, etc). Et cela n'a pas grand chose à voir avec le Moteur Wiki utilisé mais plutôt du navigateur utilisé, etc ... http://wiki.crao.net/index.php/WebSémantique écrit sans coder l'accent aigue passe très bien, de toute façon ... donc, en fait ... attention aux copier/coller à partir de votre navigateur :) -- Arnaud Fontaine

Comme je n'ai pas bien compris ce que tu expliques, je suis allé un peu plus loin et j'ai enfin trouvé la RFC qui explique l'encodage des URL. Il s'agit du chapitre "2.2. URL Character Encoding Issues" de la RFC:1738. Ce passage liste les caractères possibles pour une URL. Je vais approfondir et faire des tests... -- Charles Nepote

Bon les cas de test ci-dessous semblent montrer que l'usage de Mot Wiki accentués ne dépend pas que des navigateurs. Php Wiki a en effet le bon goût de recoder un Mot Wiki accentué pour qu'il soit lisible quelque soit le navigateur. En revanche, Php Wiki ne réalise pas ce travail pour les liens classique (par exemple : http://wiki.crao.net/index.php/WebSémantique )... -- Charles Nepote

Cas de Test

=====> Syntaxe Wiki => contenu de l'attribut HTML href => contenu de <a></a>

1. =====> Web Sémantique donne :

Web Sémantique => http://wiki.crao.net/index.php/WebS%E9mantique => Web Sémantique

2. =====> François Hodierne donne :

François Hodierne => http://wiki.crao.net/index.php/Fran%E7oisHodierne => François Hodierne

3. =====> Éditer Le Contenu donne :

Éditer Le Contenu => http://wiki.crao.net/index.php/%C9diterLeContenu => Éditer Le Contenu

4. =====> http://wiki.crao.net/index.php/WebSémantique donne :

http://wiki.crao.net/index.php/WebSémantique =>
http://wiki.crao.net/index.php/WebSémantique =>
http://wiki.crao.net/index.php/WebSémantique

Résultats des tests

Tous les cas de test fonctionnent pour les navigateurs suivants : Mozilla 1.0, Lynx 2.8.4rel.1, Links 0.4pre5, wget 1.8.1, Konqueror 2.2.2, Dillo 0.6.4.

Agents utilisateurs non testés : Safari, htdig, autres moteurs de recherche du web, aspirateurs, etc.

Le cas 4 ne donne pas le résultat escompté sur Internet Explorer? 5.0. On obtient la page suivante :

Web Sémantique
Décrivez WebSémantique ici.

Le caractère est encodé en utf-8. Les exemples donnés précédement étaient encodés en iso8859-1. La RFC1738 cité n'est pas suffisante à lever l'ambiguïté, car elle n'impose pas d'encodage particulier. Or, si beaucoup de sites européens sont en 8859-1, de plus en plus de sites sont en utf-8 qui est d'ailleur l'encodage par défaut de XHTML et de XML. Encore une source d'emm... à l'horizon. Ce qu'en pense Google-Fight -- François Granger

Les résultats de Google montrent également qu'il y a un problème quelque part... il répertorie en effet les pages WebSémantique et WebSémantique.
-- Charles Nepote

Avec Internet Explorer 6.0, j'obtiens la page "Web Sémantique" lorsque je copie/colle l'url http://wiki.crao.net/index.php/WebSémantique : le navigateur encode l'url en UTF-8 par defaut. ("Always send utf8 urls" dans les options avancees). Mais bon, la RFC que tu cites le dis bien
URLs are written only with the graphic printable characters of the US-ASCII coded character set. The octets 80-FF hexadecimal are not used in US-ASCII, and the octets 00-1F and 7F hexadecimal represent control characters; these must be encoded.

Peux-tu me dire ce que tu obtiens en cliquant sur le lien du cas 4 (et non en faisant seulement le copier/coller) ? -- Charles Nepote

Conclusion : écrire http://wiki.crao.net/index.php/WebSémantique n'est pas correct, parce que comme tu le soulignes, c'est impossible de savoir quel encodage utiliser. Ca pourrait etre du iso-latin-1, comme de l'utf8 ou une bonne dizaine d'autres encodages. Le navigateur ne sait pas si le serveur de Crao Wiki utilise l'un ou l'autre ou le quinzieme.

Mon avis perso: je préfère avoir des urls imprimables sans encodage hexadecimal, et donc j'enleve les accents, et sur Joueb Point Com, on peut taper les Mots Wiki avec ou sans accent, on arrive à la page Web Semantique? de toutes facons. Il n'y a pas d'ambiguite puisque les Mots Wiki sont tapes avec des accents (pour ceux d'entre nous qui ont un clavier azerty en tous cas). Par contre, il peut y avoir collision, comme dans le cas Un Homme Tue? si je veux absolument avoir un Mot Wiki pour chaque. En pratique, ca n'arrive jamais.

En pratique, ça n'arrive jamais. Je ne suis pas du tout d'accord. Je peux de fournir des dizaines d'exemples. Pour faire court, il y a notamment tous les verbes au participe passé : exemples : Projet Presse, Projet Rate?, Avantage Marque?, etc. Il y beaucoup de cas très simples où il y a un risque fort d'ambiguité. -- Charles Nepote

Je parlais de la collision : si tu veux un Mot Wiki Avantage Marqué? et aussi un Mot Wiki Avantage Marque? sur un même wiki, effectivement, il y a un probleme de collision. Mais en pratique, ca n'arrive pratiquement (c'est le cas de le dire) jamais. La solution d'enlever les accents des Mots Wiki dans les URLs n'est pas ambigue, tu ecris Avantage Marqué? dans ton texte, mais l'url correspondante est http://truc/AvantageMarque au lieu de http://truc/AvantageMarqu%E9. Entre une URL sans accent mais lisible et une URL illisible, je préfère la première. -- Stephane Gigandet


Astuces :

  • 2 lettres en capitales qui se suivent ne forment pas un Mot Wiki. CHamot n'est pas un Mot Wiki. Ecrivez plutôt Chat Mot. Les deux majuscules du mot évoquent les deux bosses du chameau (voir Atout Wiki).
  • Sur Crao Wiki les lettres accentuées sont acceptées. Les cédilles aussi. Inutile de créer le Mot Wiki FrancoiseHardy. Ecrivez Françoise Hardy ? Pluriel d'un Mot Wiki ? évitons de multiplier le nombre de pages inutiles. Si vous voulez parler de Web Log au pluriel, vous pouvez écrire Web Logs en plaçant le Mot Wiki entre crochets.

Voir aussi en anglais Wiki:WikiNamePluralProblem pour des solutions historiques

Cela pose plus de problèmes en francais qu'en anglais : il faut ajouter la distinction féminin/masculin à la distinction singulier/pluriel, et même cette dernière est plus compliquee. En effet, en français, on accorde les adjectifs. En anglais, on peut créer Red Apple? comme Mot Wiki, et éventuellement y ajouter un s pour donner Red Apple?s avec le même mot wiki, mais en français, on est obligés de mal ecrire Pomme Rouge?s?. Sur Joueb Point Com, j'ai implementé un système tout simple : on peut ajouter autant de Mots Wiki synonymes que l'on souhaite. Pour plus d'information, voir mon article sur Jou Jou Joueb : Un MotWiki, Des MotsNiaques -- Stephane Gigandet

Existe-t'il des règles éditoriales relatives aux Mot Wiki sur Crao Wiki ? Je vous recommande la lecture des règles de nommage sur Wiki Pédia. Pour les pluriels, ils ont systématisé l'emploi du singulier réécrit en pluriel au cas par cas : Mots Wiki. Il est vrai que Wikipédia vise une qualité de rédaction professionnelle et "grand public". -- Charles Nepote

Dernière modification le mardi 9 mars 2004 7:37:52

Éditer HistoriqueDeLaPage Diff  InfosSurLaPage