Je vous ai récemment parlé des logarithmes, à l’occasion de la présentation de ma collection de règles à calcul. Comme promis, on va aller un peu plus loin dans leur exploration.
Qu’est-ce que cette bête-là ?
Tout d’abord, je ne suis pas le seul à trouver sublime cette fonction mathématique, Mickaël Launay, qui anime la chaîne Youmachin Micmaths juge aussi les logarithmes merveilleux. Comme, en 2014, il a fait une vidéo très didactique à l’occasion des 400 ans de leur découverte par John Neper (ou Napier), je vous invite à la regarder pour vous remettre tout cela en mémoire.
Voila, vous avez compris, les logarithmes, ça sert notamment à remplacer une multiplication par une addition, plus simple à effectuer, ou une division par une soustraction. Pour cela, on s’appuie sur des tables de logarithmes, Mickaël Launay vous a montré, comme une relique, le Bouvart et Ratinet qui a été largement utilisé en France. Moi, ces tables je les ai achetées l’année de mon Bac soit en 1971-1972, c’est vous dire si je suis une relique.
Important pour la suite : les pages présentées à droite, qui sont dans les toutes premières du livret, donnent les logarithmes pour les nombres commençant par 1, les pages suivantes le font pour les nombres commençant par les autres chiffres.
J’ai encadré quelques nombres qui vous permettront de refaire le calcul que je vais résumer ci-dessous.
- je veux calculer 121 x 132.
- le logarithme de 121 est 2,08279 (premier cadre rouge)
- le logarithme de 132 est 2,12057 (deuxième cadre rouge)
- leur total est donc 4,20336, ce qui est le logarithme du nombre 15972 (cadres rouges sur la deuxième page)
Voila, ce n’est pas plus compliqué que cela en théorie. Dans la pratique, il faut savoir naviguer dans les tables, jongler avec les puissances de 10 et interpoler les valeurs numériques pour faire des calculs bien plus compliqués que mon exemple.
La loi de Benford
En 1881, un astronome américain, Simon Newcomb constate que les premières pages des tables de logarithmes sont beaucoup plus usées que les suivantes. Les pages qui servent à trouver le logarithme des nombres commençant par 1 sont donc plus souvent manipulées par les utilisateurs, ce qui signifie que les calculs conduisent plus souvent à des résultats commençant par 1. Dans un article, il propose une loi qui exprime le fait que le premier chiffre significatif d’un nombre est plus fréquemment le 1 que le 2, le 2 lui-même plus fréquent que le 3, et ainsi de suite jusqu’à 9.
Personne ne porte attention à cet article, et la loi est redécouverte en 1938, sur la base des mêmes observations, par le physicien américain Frank Benford qui lui donnera son nom, de manière indue (on devrait dire la loi de Newcomb-Benford). En bref, la fréquence d’apparition de la première décimale suit la courbe suivante.
La fréquence d’apparition du chiffre c en première position est donnée par la formule utilisant elle-même les logarithmes :
Étonnant, non ? Pour que cette loi soit vérifiable sur une grande quantité de données numériques, il ne faut pas que celles dernières soient soumises à des contraintes artificielles. Par exemple, si l’on prend la taille des individus, il y a de fortes chances que ces valeurs commencent dans leur immense majorité par un 1. De la même manière, les numéros de téléphones, les numéros de sécurité sociale, etc…
Ce qui paraît encore plus étonnant, c’est que cette loi ne dépend pas de l’unité utilisée. Si on la vérifie sur les cours de la bourse en euros, elle sera vérifiée de la même manière si on calcule ces cours en dollars, en yens, en livres, etc.
J’ai voulu faire ma propre vérification sur une collection de données et pour cela, j’ai recherché la superficie en hectares des 36 000 communes de France. J’ai également transformé cette superficie en miles carrés, histoire de voir si le changement d’échelle conduisait aux mêmes conclusions. Voici mes résultats sous forme de graphique.
Les superficies des communes de métropole vont de 4 hectares (Castelmoron d’Albret) à près de 76 000 hectares (Arles), les données numériques sont donc bien variables et ne semblent pas être cantonnées dans des intervalles artificiels.
On constate cependant que la loi de Benford est approchée sur ces données : le chiffre 1 est en première position pour 33,6% des superficies en hectares et 25% pour les superficies en miles carrés (la loi donne 30,1%). Par contre, si on prend en compte les 72 000 données (superficies en hectares et en miles carrés), on l’approche de plus près, avec 29,3% pour le 1, 16,76% pour le 2, 12,45% pour le 3, etc.
Bon ! je ne crois pas que mon traitement statistique soit rigoureux (cumuler deux fois les mêmes données à des échelles différentes !) mais je dois avouer que lorsque mon tableau de 36 000 lignes m’a livré ces résultats, j’ai été agréablement surpris et étonné.
Le fait que la loi soit seulement approchée signifie sans doute que pour une raison ou une autre, les superficies des communes ne sont pas totalement “aléatoires” en raison de l’histoire ou de l’organisation administrative ou autre chose.
Et les services fiscaux dans tout ça ?
La loi de Benford a intéressé assez rapidement les services fiscaux américains qui y voyaient une méthode pour détecter les fraudes.
En fait, nous sommes étonnés par les conclusions de la loi parce que nous nous attendons à ce que les premiers chiffres significatifs d’un ensemble de valeurs numériques soient également répartis entre les chiffres de 1 à 9. Mais c’est uniquement une intuition, fausse, qui nous fait croire cela.
Loin de moi l’idée de vous démontrer la loi, sachez simplement qu’elle se vérifie, toute étonnante qu’elle nous paraisse.
Résultat de cette intuition : lorsque des fraudeurs truquent des résultats comptables avec des valeurs inventées, ils ne respectent pas les pourcentages de répartition prévus par la loi de Benford. Pour les services fiscaux, c’est tout bénéfice car de simples calculs statistiques sur des milliers et des milliers de valeurs numériques permettent de détecter où sont susceptibles de se cacher des fraudes, sans les prouver bien entendu. Les contrôles approfondis peuvent être ainsi mieux ciblés.
La loi a été également utilisée dans d’autres domaines, comme la détection des études scientifiques bidon ou les fraudes électorales.
Si vous voulez approfondir le sujet, l’excellente revue québécoise de mathématiques, Accromath, totalement libre d’accès, a publié en 2010 un article sur la loi de Benford : Volume 5 – Été automne 2010.
Plus corsé : POURQUOI LA LOI DE BENFORD N’EST PAS MYSTÉRIEUSE par Nicolas GAUVRIT et Jean-Paul DELAHAYE.
On trouve beaucoup d’autres articles scientifiques sur la loi de Benford sur internet, cela pourra occuper votre temps libre …
0 commentaire