Mon billet d'hier a fait naître chez moi une réflexion... J'y abordais la question de la recherche d'information autre que du texte, notamment la musique et les molécules chimiques. En fait, dans tous les cas, cela revient àse ramener àun système de codage qui rende possible la recherche. Souvenons-nous, il y a quelques années, avant l'apparition de l'ordinateur, les recherches étaient effectuées avec des cartes perforées, le codage étant basé sur l'absence/présence de trous et leurs emplacements :

Mais pourquoi ne pas conserver le codage original de la musique en notes ou des molécules en structures topologiques ? Parce que ce ne sont pas des systèmes de codage mais des représentations ; comment rechercher une structure comme celle-ci ?

Alors qu'avec le codage de Derwent, cela donne quelque chose comme

D621 H541 H602 J171 M412 M511 M520 etc.

Idem pour les partitions de musique qui peuvent être converties par le code de Parsons en "*DUUDUDDUDU".

Bon. Mais c'est làque je sèche : pourquoi les systèmes de codage utilisés actuellement avec l'informatique sont-ils àbase de chiffres et lettres ? Deux questions :

  • L'informatique fonctionne selon un système binaire ; quelle est la couche entre les instructions binaires 0/1 et les caractères (lettres, chiffres etc.) ?
  • Pourquoi coder àbase de chiffres arabes et de lettres romaines ? Parce que c'est le système le plus répandu et "naturel" ou pour une raison plus valable ? Et dès lors, pourrait-on envisager un codage àbase de caractères Unicode exotiques, comme ・⊕ ı ༃ auxquels on attribuerait un ordre pour pouvoir les ranger, comparer etc. ?

Je fais appel àvotre sagacité...