« Je suis en train de lire Antifragile de Nassim Taleb et je me suis ainsi retrouvé à relire des morceaux de son extraordinaire Black Swan. (…) Ici, je vais m’adresser à l’un des (…) thèmes qui trouve écho parmi les gens qui travaillent sur les inégalités de revenu (…).

La contribution de Taleb est ici particulièrement cruciale. Les répartitions qui ont de longues extrémités à droite, comme les répartitions du revenu et surtout du patrimoine, sont caractérisées par des valeurs moyennes et des inégalités qui dépendent fortement des extrêmes. De plus, pour les événements extrêmes, comme Taleb l’écrit, les écarts-types ne sont pas pertinents. Donc les répartitions ne peuvent être pleinement décrites par la moyenne et la variance comme nous avons généralement tendance à le faire lorsque nous travaillons sur les inégalités. (Si la variance, comme l’écrit Taleb, reflète l’incertitude entourant la moyenne, alors la non-pertinence de la variance implique que nous ne sachions pas ce que nous ne savons pas, le "savoir inconnu" de Rumsfeld.)

Les statisticiens qui travaillent sur les inégalités savent depuis longtemps, de façon heuristique, dans quelle mesure leurs résultats, des coefficients de Gini aux indices de Theil et aux parts de revenu, dépendent des valeurs extrêmes et ils essayaient de résoudre ce problème en écartant les extrêmes, notamment en tronquant les valeurs au-dessus d’un certain maximum. Ce soi-disant "codage supérieur" (top-coding) était adopté jusqu’à il y a peu par le Bureau américain du recensement dans ses enquêtes sur la population courante, la principale source de données relatives à la répartition du revenu pour les Etats-Unis (…). Puisque les enquêtes auprès des ménages reposent sur des échantillons aléatoires, l’idée n’a pas été de laisser les valeurs extrêmes qui peuvent être décelées au cours d’une année, mais pas au cours des autres, affecter déraisonnablement à la fois la moyenne et les mesures d’inégalités. Par exemple, si vous interrogez Bill Gates cette année, mais pas avant, ni de nouveau après (ce qui est très probable dans la mesure où les personnes qui détiennent une telle richesse sont extrêmement rares), le revenu moyen et les inégalités aux Etats-Unis apparaitront cette année comme particulièrement fortes. Vous vous retrouverez avec des centaines de documents de recherche et de dissertations doctorales cherchant à déterminer quelle politique économique a conduit à une telle hausse des inégalités aux Etats-Unis, alors que, bien sûr, la seule raison tient à l’échantillonnage.

Nassim est un fervent admirateur des lois de puissance qui s’appliquent aux répartitions après un certain point (le "point de croisement"). Cela a aussi été utilisé en pratique en utilisant des répartitions log-normales qui tiendraient la route à un certain (haut) niveau de revenu avec une répartition à la Pareto qui se vérifierait par la suite. (Une répartition suit une loi de Pareto si pour chaque hausse de x pourcents du revenu, il y a une baisse de αx dans le pourcentage de récipiendaires de tels hauts revenus. α est la "constante" de Pareto.) Alternativement, certaines personnes (notamment Viktor Yakovenko ici) ont combiné des répartitions exponentielles et à la Pareto : la première serait une répartition qui s’applique aux salariés (les 95 % les moins riches), la seconde aux capitalistes (les 5 % les plus riches). Anwar Shaikh a utilisé cette répartition "combinée" dans son monumental Capitalism pour discuter de la relation entre les inégalités de revenu et les crises financières.

Mais je suis en désaccord avec Nassim à propos de la constance de α, qui découle de l’approche fractale de Mandelbrot sur laquelle se base Nassim. Je ne suis pas en train de parler de l’idée de Pareto d’une constance de α dans l’espace et dans le temps. Cela a été déjà suffisamment réfuté (…). Je parle du fait empirique que lorsque nous regardons les répartitions du revenu, selon la part du sommet nous considérons, α change. Je m’y étais intéressé il y a plusieurs années (…). J’avais posé la relation In H(y) = A- α In yH désignait la répartition cumulative inverse, Y le revenu, α la "constante" de Pareto ou la "guillotine" (parce qu’elle "réduit" le nombre de récipiendaires dans la mesure où le revenu augmente), sur des fragments du sommet de plus en plus petits : tout d’abord pour les 20 % les plus riches, puis pour les 19 % les plus riches, puis pour les 18 % les plus riches, etc., et ainsi jusqu’aux 1 % les plus riches. Je ne m’attends pas à ce que la guillotine reste de même pente.

Dans certains cas, la pente de la ligne peut être négative (α s’accroît en termes absolus) si les répartitions proches du sommet tendent à être plus "raréfiées" que les répartitions le long de l’ensemble des 20 % les plus riches. Comme on le voit sur le schéma ci-dessous, c’est le cas des Etats-Unis. Si vous avez seulement 100 personnes avec des revenus supérieurs à plusieurs centaines de millions de dollars, alors élever le seuil d’environ 10 % (par exemple) ferait peut-être basculer 20 ou 30 d’entre eux sous le nouveau seuil. Dans la partie intermédiaire, très "dense", de la répartition du revenu, vous pouvez accroître le seuil de 10 % et très peu de gens, en pourcentage, vont chuter : peut-être seulement 1 %. Donc, autour du sommet, la guillotine serait de -2 ou de -3, tandis qu’au niveau intermédiaire elle serait de -0,1.

GRAPHIQUE Constante de Pareto pour les répartitions de l’Allemagne, des Etats-Unis et du Royaume-Uni

Branko_Milanovic__Constante_de_Pareto_pour_les_repartitions_de_l_Allemagne__des_Etats-Unis_et_du_Royaume-Uni.png

Mais dans le cas de l’Allemagne et du Royaume-Uni, dont les répartitions semblent presque identiques excepté pour les 1 % les mieux rémunérés, la guillotine de Pareto décline en termes absolu à mesure que l’on se rapproche du sommet. La répartition autour du sommet est plus dense.

Dans d’autres cas, comme l’Egypte, présentée dans le graphique ci-dessous avec l’Italie et les mêmes données pour l’Allemagne, la constante de Pareto est plus faible (en termes absolus) presque à travers l’ensemble des 20 % les plus riches. La répartition de l’Egypte est plus dense que celle de l’Allemagne et de l’Italie (presque) tout du long. Etrangement, l’Italie se rapproche de ce que Pareto aurait cru.

GRAPHIQUE Constante de Pareto pour les répartitions de l’Allemagne, de l'Egypte et de l'Italie

Branko_Milanovic__Constante_de_Pareto_pour_les_repartitions_de_l_Allemagne__Egypte__Italie.png

Le point clé est que la loi de puissance fonctionne avec une intensité inégale même sur la portion de la répartition où nous croyons qu’elle s’applique (c’est-à-dire au-dessus du "point de croisement"). Donc, dans l’équation ci-dessus, nous devons écrire α(y) plutôt que α.

La différence dans les niveaux de la guillotine entre l’Egypte et l’Allemagne ou l’Italie illustre un autre point : des guillotines moins tranchantes (si elles tenaient tout le long de la répartition) comme en Egypte vont être associées à de plus hauts niveaux d’inégalités globales parce qu’elles impliquent des extrémités plus épaisses. Des guillotines plus tranchantes impliquent moins d’épaisseur dans les extrémités et donc moins d’inégalités. Cela transparaît à travers le fait que le Gini d’une répartition à la Pareto est égale à 1/(2α-1) et que lorsque α s’accroît en termes absolus (c’est-à-dire la répartition se raréfie), le Gini décline.

Où cela nous amène-t-il ? A une approche fractale modifiée : lorsque nous découpons les répartitions du revenu et des richesses toujours plus finement, le même phénomène ne se répète pas avec une même intensité mais, selon la répartition, avec une plus ou moins grande intensité. La constante de Pareto varie tellement que l’on peut se demander comment le terme "constante" puisse lui être appliqué. »

Branko Milanovic, « Pareto, Taleb and the tails of income distributions », in globalinequality (blog), 8 janvier 2017. Traduit par Martin Anota