Analyse de fréquence

 

Historique :

L’analyse de fréquence est une méthode de cryptanalyse révolutionnaire. Les premières traces de cette technique furent l’œuvre d’un sage, al-Kindi né à Bagdad en 801 après J.C. Elles furent retrouvées dans son traité Manuscrit sur le déchiffrement des messages cryptographiques. Cette découverte donnera la main aux cryptanalystes pour un moment.

Pratique :

Cette technique, permet de décrypter un message chiffré avec une méthode de chiffrement par substitution. Elle utilise la particularité du chiffrement par substitution qui fait que chaque nouvelle lettre garde sa position ainsi que la fréquence d’apparition de chaque lettre dans la langue du message. Par exemple en français, la lettre la plus utilisée est le « E » avec 17.52% d’utilisation.

Elle étudie aussi la fréquence d’apparition des bigrammes, c’est-à-dire la fréquence d’apparition de groupes de deux lettres employés pour transcrire un phonème unique (par exemple, le son [ʃ] est transcrit en français par le digramme ch).

Pour nous aider dans notre recherche du message, nous pouvons également étudier l’indice de coïncidence. L’indice de coïncidence est une technique de cryptanalyse inventé par Friedman en 1920 et publiée dans The Index of Coincidence and its Applications in Cryptography. Cet indice permet de savoir si un texte a été chiffré avec un chiffre mono-alphabétique ou poly-alphabétique en étudiant la probabilité de répétition des lettres du message, en effet dans le cas d’une substitution mono-alphabétique, l’indice ne changera pas.

L’indice de coïncidence donne également une indication sur la longueur de la clé. Dans le cas d’une attaque par force brute, cet indice peut nous permettre de savoir si le test en cours est concluant en comparant cet indice avec l’indice de coïncidence de la langue française qui est d’environ 0.0746.

L’indice de coïncidence se calcule avec la formule : Indice de coïncidence

Avec n le nombre de lettres du message, nA le nombre de A, nB le nombre de B …

Il nous suffira donc de regarder dans notre texte quelle est la lettre la plus utilisée, de ce fait, plus le texte chiffré est long, plus la fréquence d’apparition des lettres sera exacte.

« En Virginie, dans le Vermont et à Vancouver, le vert vif des vallées verdoyantes est vivifiant »

Par exemple dans ce texte nous pouvons voir une importante quantité de « V » ce qui déstabilisera la technique de l’analyse de fréquence une fois chiffrée. Connaître le thème du texte est également utile car une poésie et un texte militaire n’auront pas la même fréquence d’apparition des lettres.

Les quelques lettres, qui auront échappé à cette méthode, seront retrouvées par l’homme en fonction du mot le plus proche, par exemple « voityre » sera sûrement « voiture ».

Analyse de fréquence

Questionnaire portant sur l’analyse de fréquence

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.