Codage et recherche d'information

Par Enro, mercredi 29 juin 2005 à 09:02 :: Internet & TIC :: #185 :: rss

Mon billet d'hier a fait naître chez moi une réflexion... J'y abordais la question de la recherche d'information autre que du texte, notamment la musique et les molécules chimiques. En fait, dans tous les cas, cela revient àse ramener àun système de codage qui rende possible la recherche. Souvenons-nous, il y a quelques années, avant l'apparition de l'ordinateur, les recherches étaient effectuées avec des cartes perforées, le codage étant basé sur l'absence/présence de trous et leurs emplacements :

Mais pourquoi ne pas conserver le codage original de la musique en notes ou des molécules en structures topologiques ? Parce que ce ne sont pas des systèmes de codage mais des représentations ; comment rechercher une structure comme celle-ci ?

Alors qu'avec le codage de Derwent, cela donne quelque chose comme

D621 H541 H602 J171 M412 M511 M520 etc.

Idem pour les partitions de musique qui peuvent être converties par le code de Parsons en "*DUUDUDDUDU".

Bon. Mais c'est làque je sèche : pourquoi les systèmes de codage utilisés actuellement avec l'informatique sont-ils àbase de chiffres et lettres ? Deux questions :

L'informatique fonctionne selon un système binaire ; quelle est la couche entre les instructions binaires 0/1 et les caractères (lettres, chiffres etc.) ?
Pourquoi coder àbase de chiffres arabes et de lettres romaines ? Parce que c'est le système le plus répandu et "naturel" ou pour une raison plus valable ? Et dès lors, pourrait-on envisager un codage àbase de caractères Unicode exotiques, comme ・⊕ ı ༃ auxquels on attribuerait un ordre pour pouvoir les ranger, comparer etc. ?

Je fais appel àvotre sagacité...

Commentaires

1. Le samedi 2 juillet 2005 à 20:09, par Oré

Pas inintéressantes ces questions!
Le codage informatique reste un outil humain de contrôle des machines. Donc il se doit de ne pas être trop complexe, non? N'est-ce pas pour ça que les caractères exotiques ne sont pas utilisés?
Sur ce site ils expliquent bien comment on passe du codage binaire au codage des caractères: www.commentcamarche.net/b...
A garder sous la main pour les nuls comme moi, au cas où un informaticien vous sorte un mot "exotique" ;-)

2. Le lundi 4 juillet 2005 à 08:30, par Enro

Oré > Merci pour le lien, on y apprend en effet que le premier jeu de caractères (ASCII, défini dans les années 1960) a été codé sur 7 bits, soit 128 caractères possibles. Puis on est passé au ASCII étendu codé sur 8 bits soit 256 caractères possibles, dont les lettres accentuées. Enfin, en 1991 a été mis au point Unicode codé sur 16 bits !!

Voilàqui répond àma première question.

Ajouter un commentaire

Les commentaires pour ce billet sont fermés.

My first weblog