Mon billet d'hier a fait natre chez moi une rflexion... J'y abordais la question de la recherche d'information autre que du texte, notamment la musique et les molcules chimiques. En fait, dans tous les cas, cela revient se ramener un systme de codage qui rende possible la recherche. Souvenons-nous, il y a quelques annes, avant l'apparition de l'ordinateur, les recherches taient effectues avec des cartes perfores, le codage tant bas sur l'absence/prsence de trous et leurs emplacements :

Mais pourquoi ne pas conserver le codage original de la musique en notes ou des molcules en structures topologiques ? Parce que ce ne sont pas des systmes de codage mais des reprsentations ; comment rechercher une structure comme celle-ci ?

Alors qu'avec le codage de Derwent, cela donne quelque chose comme

D621 H541 H602 J171 M412 M511 M520 etc.

Idem pour les partitions de musique qui peuvent tre converties par le code de Parsons en "*DUUDUDDUDU".

Bon. Mais c'est lque je sche : pourquoi les systmes de codage utiliss actuellement avec l'informatique sont-ils base de chiffres et lettres ? Deux questions :

  • L'informatique fonctionne selon un systme binaire ; quelle est la couche entre les instructions binaires 0/1 et les caractres (lettres, chiffres etc.) ?
  • Pourquoi coder base de chiffres arabes et de lettres romaines ? Parce que c'est le systme le plus rpandu et "naturel" ou pour une raison plus valable ? Et ds lors, pourrait-on envisager un codage base de caractres Unicode exotiques, comme ・⊕ ı ༃ auxquels on attribuerait un ordre pour pouvoir les ranger, comparer etc. ?

Je fais appel votre sagacit...