Liste des articles
L’analyse prédictive, utilisée depuis plusieurs années en actuariat et en assurance, apporte une aide intéressante aux professionnels des Ressources Humaines, plus spécifiquement dans les domaines suivants :
[caption id="attachment_2185" align="aligncenter" width="1778"] Exemple d’arbre avec identification de groupes femmes/hommes
Le modèle de CART présente deux avantages principaux : un résultat facilement interprétable et une bonne prise en compte sans a priori des interactions entre les variables. Elles sont sensibles aux données utilisées et le résultat pourra différer en cas de variation des variables, ce qui nécessite un suivi régulier. Le genre représentant un signal faible dans l’explication du salaire, il est parfois nécessaire de descendre plusieurs nœuds de l’arbre pour faire apparaître le genre comme variable discriminante. Dans l’ensemble des travaux, des tests sont réalisés, notamment la vérification de la disparition du genre comme variable discriminante en cas de modifications des salaires en suivant les préconisations brutes du modèle.
[1] L’article L2242-5 du Code du Travail impose aux entreprises de plus de 50 salariés d’engager chaque année une négociation sur les objectifs d’égalité professionnelle entre les femmes et les hommes.
[2] Les études produites dans la presse font habituellement état d’écarts femmes/hommes de plus de 20% et comparent des cas qui ne sont pas nécessairement représentatifs des situations rencontrées dans les entreprises étudiées.
[3] Nelder J.A. & Wedderburn R.W.M. Generalized linear models. Journal of the Royal Statistical Society A 135:370-384 ; 1972.
[4] Breiman L, Friedman JH, Olshen RA, Stone CJ. Classification And Regression Trees. CRC Press; 1984. Breiman L. Random forests. Machine Learning 2001, 45:5–32.
Vue 44 fois
28 avril 2017
Ressources Humaines et modèles prédictifs : application à l’égalité femmes/hommes
Regards croisés Compensations&Benefits et actuaire
Une démarche « gender diversity » a été initiée chez Faurecia, équipementier automobile de 100 000 salariés dans 35 pays. Cette démarche est déclinée sur l’ensemble des fonctions, et en particulier la rémunération, pour repérer s’il y a ou non des écarts de salaire expliqués par le genre. Faurecia a décidé de faire appel à Galea, cabinet d’actuaires, qui propose des analyses permettant de dépasser les études classiques qui n’identifient pas toujours un « signal faible » comme la variable genre. Cet article présente en premier lieu les analyses d’un point de vue théorique, puis l’utilisation pratique qu’en a faite Faurecia.L’analyse prédictive, utilisée depuis plusieurs années en actuariat et en assurance, apporte une aide intéressante aux professionnels des Ressources Humaines, plus spécifiquement dans les domaines suivants :
- la gestion des risques RH : absentéisme, maladie, stress.
- la gestion des personnes : évolution des salaires, promotions, recrutements, départs.
- l'optimisation des dispositifs internes : compte-épargne temps, choix en matière d’épargne salariale et de retraite, couvertures santé et prévoyance.
- la réponse aux demandes réglementaires : qualité de vie au travail, égalité femmes/hommes.
- identifier si l’entreprise a actuellement une problématique d’égalité femmes/hommes à traiter,
- mesurer les écarts existant effectivement au sein de l’entreprise[2],
- arrêter une première liste de femmes potentiellement concernées,
- aider le responsable RH à définir un plan d’actions pour corriger les éventuelles inégalités,
- permettre un suivi régulier de l’efficacité des actions engagées par la mise en place d’indicateurs adaptés.
- la sélection des données à prendre en compte pour l’analyse, compte tenu de la culture et du contexte de l’entreprise et des données disponibles,
- la recherche de la modélisation la plus adaptée,
- la mise en place de la démarche,
- son appropriation par les équipes opérationnelles et les dirigeants.
En premier lieu, la formulation précise de la question à laquelle répondre
En matière d’égalité femmes/hommes au sein de l’entreprise, la question principale est simple à formuler : des différences de rémunérations entre femmes et hommes peuvent-elles exister « toutes choses égales par ailleurs » ? Des études Insee révèlent souvent des écarts moyens importants entre les femmes et les hommes au niveau national, qui recouvrent des situations diverses avec des écarts liés au genre, mais aussi à l’âge, à l’ancienneté, au niveau de responsabilités, au temps travaillé, etc. L’entreprise doit être en mesure d’identifier les écarts dus au genre.L’identification et la qualification des données utiles
L’utilisation des modèles prédictifs nécessite celle de données globales et individuelles, en conformité avec les législations et réglementations concernées. Des échanges spécifiques sur ce point interviennent en général avec le responsable RH lors de la sélection des données. Dans la pratique, plus les données individuelles collectées dans le système d’informations (SIRH) sont nombreuses, plus il est possible de mener des analyses fines. La mise en œuvre de la Déclaration Sociale Nominative (DSN) devrait faciliter les travaux. Outre les données habituelles (identifiant, date de naissance, date d’entrée dans l’entreprise ou le groupe, genre, CSP, métier exercé/fonction, type de contrat, temps travaillé, échelon/catégorie, site), des données complémentaires sont utiles suivant la nature des travaux RH à effectuer (job grading, formations suivies, situation familiale, nombre d’enfants à charge, périodes et motifs d’absences, etc). L’absence de certaines données ou le manque de fiabilité nécessite d’effectuer des choix avec le responsable RH, tels que la non prise en compte de certaines variables dans l’attente de l’amélioration du système d’informations. Cette étape d’arbitrage entre volume et qualité de la donnée constitue un travail assez classique pour les actuaires. Le recours à des données externes à l’entreprise (open data) ne constitue pas une priorité pour les premiers travaux RH qui privilégient une approche smart data. Dans le cas des travaux sur l’égalité femmes/hommes, le système d’informations de l’entreprise permet d’extraire rapidement plusieurs données a priori utiles à l’étude et de s’assurer de leur qualité : salaire (fixe et variable), grade, âge, ancienneté dans la société, ancienneté dans le poste, famille du poste, région, genre, etc. Des contrôles de cohérence sont réalisés et certaines données doivent être éliminées comme le temps partiel et la formation. Des regroupements, par tranches d’âge par exemple, sont également réalisés pour compenser une éventuelle insuffisance de données. Tout au long de ces travaux, des discussions doivent intervenir avec le Comp&Ben pour comprendre le contexte et s’assurer de la prise en compte de l’ensemble des variables pertinentes et disponibles.Le traitement statistique préalable
Des statistiques descriptives classiques dans les travaux RH sont établies pour les différentes variables disponibles, pour identifier celles qui a priori joueront un rôle important dans l’explication des écarts de rémunération. La comparaison de l’évolution des salaires pour les salariés « présents-présents » (c’est-à-dire restreinte à ceux qui sont là deux années de suite, ce qui permet de calculer l’évolution), sur les salaires à l’embauche et diverses représentations graphiques, notamment sous forme de nuages de points, fournissent une première vision de la situation et permettent d’identifier si la problématique existe. Dans de nombreux travaux sur l’égalité femmes/hommes, ces statistiques illustrent un « plafond de verre », c’est-à-dire un niveau de salaire et/ou de responsabilité que les femmes ne dépassent que difficilement. Les statistiques peuvent aussi indiquer des augmentations de salaires récentes plus élevées pour les femmes, signe d’une prise de conscience d’écarts dans les rémunérations et d’une volonté de les réduire. Les techniques issues de l’analyse prédictive permettront alors de porter un avis objectif sur les stratégies de réduction en vigueur.Le choix de la démarche et des modèles pour établir un bon diagnostic, puis l’évaluation de leur efficacité
Deux analyses sont proposées dans le cadre de l’égalité femmes/hommes, pour dépasser les études classiques qui n’identifient pas toujours un « signal faible » comme la variable genre :- La première cherche à savoir si le genre est un critère a priori explicatif du niveau des rémunérations dans l’entreprise (salaire de base d’une part, salaire de base et bonus cible d’autre part).
- La seconde analyse cherche à identifier une liste de femmes qui seraient en écart de salaire compte-tenu de leur positionnement, de leur ancienneté, des pratiques de rémunération en interne, etc. Un algorithme a été mis en place pour expliquer la variable salaire à partir de l’ensemble des variables explicatives disponibles dans le SIRH et repérer les relations entre ces variables et le salaire. Plusieurs méthodes d’apprentissage statistiques sont disponibles : les arbres/forêts (aléatoires ou non), l’algorithme espérance-maximisation (EM), les réseaux de neurones, les support vector machines, etc.
[caption id="attachment_2185" align="aligncenter" width="1778"] Exemple d’arbre avec identification de groupes femmes/hommes
Le modèle de CART présente deux avantages principaux : un résultat facilement interprétable et une bonne prise en compte sans a priori des interactions entre les variables. Elles sont sensibles aux données utilisées et le résultat pourra différer en cas de variation des variables, ce qui nécessite un suivi régulier. Le genre représentant un signal faible dans l’explication du salaire, il est parfois nécessaire de descendre plusieurs nœuds de l’arbre pour faire apparaître le genre comme variable discriminante. Dans l’ensemble des travaux, des tests sont réalisés, notamment la vérification de la disparition du genre comme variable discriminante en cas de modifications des salaires en suivant les préconisations brutes du modèle.
La présentation des résultats et les conclusions opérationnelles (plans d’actions)
En cas d’inégalité femmes/hommes, le modèle identifie des groupes de personnes de même genre présentant globalement des écarts de salaire avec un groupe de genre opposé présentant les mêmes caractéristiques par ailleurs. L’expertise du responsable RH et/ou du Comp&Ben est alors nécessaire pour :- analyser et valider les résultats bruts du modèle,
- prendre en compte des éléments non encore disponibles de manière fiable dans les données, tels que par exemple la performance dans le poste, le parcours atypique d’un salarié ou encore le changement récent d’entreprise,
- et au final, ajuster les résultats bruts pour affiner les groupes de personnes en écarts de salaires.
- une liste de femmes (hommes) en écart de salaire a priori d’après le modèle, susceptibles de nécessiter un ajustement,
- des indicateurs pour atteindre une égalité à un horizon donné,
- des méthodes et indicateurs permettant d’anticiper et de suivre l’évolution d’une année sur l’autre et de mesurer l’efficacité des plans d’action.
La démarche en pratique vue de l’entreprise
Ce qui a intéressé Faurecia dans la démarche proposée, c’est d’utiliser la même méthodologie dans tous les pays. Les conditions étaient relativement peu contraignantes, avoir au minimum 1000 cadres, ce qui est le cas pour Faurecia dans 6 pays. A posteriori, il fallait aussi au minimum 200 femmes pour que l’analyse soit concluante. Les résultats de l’Allemagne (1035 cadres dont 90 femmes) se sont révélés inutilisables, alors que ceux de la Pologne (898 cadres dont 256 femmes) étaient tout à fait exploitables. La présentation des résultats qui a été faite à chaque pays a été l’occasion de discussions enrichissantes.Régression multiple
La diversité des résultats de la régression multiple est rassurante. Huit critères sont apparus, variables selon les pays, l’ordre d’apparition étant aussi variable, certains pays en ayant quatre, d’autres sept. Une constante a conforté la politique mise en place depuis plusieurs années maintenant. Dans tous les pays, le premier facteur explicatif de la rémunération est le grade du poste, avec un poids aux alentours de 90%. Pour le Mexique, par exemple, au-delà du grade, trois facteurs explicatifs apparaissent, la famille de métier, l’âge et la région par ordre décroissant. Cela a été un argument pour modifier cette année les bandes de salaires (minimum, référence et maximum de salaire par niveau) et prendre en compte la région. La première alerte a été que le genre apparait en facteur explicatif de la rémunération dans trois pays, les USA, la Pologne et la France, ce qui ne devrait pas être le cas, même faiblement. L’analyse plus détaillée par le modèle CART s’avère nécessaire.Analyse Cart et précautions d’usage
Des groupes de femmes ont été identifiés dans les trois pays où le genre apparait comme facteur de la rémunération, mais aussi en Chine. Il a fallu toutefois pas mal de pédagogie pour utiliser correctement cette information sur les groupes de femmes. Premier message, ces groupes sont issus d’une analyse statistique, et il est tout à fait possible d’avoir des cas isolés en dehors de ces groupes identifiés. Deuxième message, lorsque le modèle CART identifie un groupe de femmes dont le salaire moyen est inférieur à celui du groupe d’hommes ayant les mêmes caractéristiques, cela ne signifie pas qu’il faille augmenter automatiquement toutes les femmes du pourcentage de différence entre les salaires moyens (de 10% à 36% selon les pays et les groupes). Le salaire moyen recouvre une dispersion de situations individuelles. Pour ne pas brouiller le message, nous avons décidé de retirer de ces listes les femmes dont le salaire est supérieur au salaire moyen des hommes équivalents (67 retirées sur un total de 278). Sur les listes restantes, il y a une série de questions à se poser : tout d’abord, les données individuelles sont-elles exactes, en particulier le niveau de poste et le salaire, prise en compte de temps partiel… ? Existe-t-il dans l’historique ou le profil de la personne des explications comme une prise de poste récente, une performance durablement insuffisante… enfin, lorsque l’écart est confirmé, quel plan d’action pour le rattrapage, étalement sur plus d’un an… ?Mise en œuvre en 2017
Pour que les décisions soient suivies d’effet, le choix a été fait de coupler cette analyse avec la révision annuelle de salaire de 2017, en demandant à chaque entité présentant ses propositions de lister les femmes concernées avec pour chacune le plan d’action ou la raison pour laquelle aucune action particulière n’est envisagée. Il restait donc 211 femmes à examiner, avec une répartition par pays très inégale. 138 femmes aux USA, presque 30% des femmes, mais la différence de salaire moyen avec les hommes est relativement faible, autour de 10%. En Pologne près de 10% des femmes et 5% en France sont à étudier. En Chine, elles ne sont que 2% des femmes, mais les différences de salaire moyen sont au-delà de 20%. Après analyse, 42 femmes ont été retirées : grade erroné, départ de la société, temps partiel non pris en compte, performance durablement insuffisante … Par ailleurs, 4 femmes ayant été promues ont vu leur salaire augmenter sensiblement. Au final, ce sont 165 femmes qui ont été examinées sur un total de 2540 femmes dans les 5 pays finalement retenus, soit 6%. Il n’y a pas eu de budget spécial pour cette opération, la plupart des pays ayant une faible inflation et des budgets déjà tendus. A posteriori, cela n’a pas été nécessaire, vu le faible nombre concerné. La décision d’augmentation annuelle se fait de façon très classique à l’aide d’une matrice croisant la position marché et la performance, selon le budget du pays. Cette matrice indique des pourcentages d’augmentation up to à ne pas dépasser. Latitude a été donnée pour dépasser ces pourcentages si nécessaire pour les 165 femmes listées, ce qui a été le cas pour 71 d’entre elles, soit 43%. Ces quelques pourcentages supplémentaires vont permettre de converger entre salaires masculins et féminins dans les groupes identifiés.Axes de progrès
Il reste toutefois des axes de progrès : volontairement, pour la première année, aucune directive n’avait été donnée sur la façon d’analyser et traiter ces groupes de femmes : le résultat a été assez hétérogène, tant par entité que par pays, certains décidant de donner systématiquement un coup de pouce, d’autres considérant que leur pratique salariale était équitable et ne justifiait aucune mesure supplémentaire. Le salaire théorique calculé selon le modèle linéaire généralisé (cf page 3) est basé uniquement sur les données qui ont été fournies, donc des critères internes explicatifs de la rémunération. Faurecia utilise depuis plusieurs années le positionnement individuel par rapport au salaire de référence (basé sur des données internes et des références marché externes). L’articulation entre ces deux informations n’est pas évidente, car les résultats sont parfois divergents. La prise en compte du positionnement individuel par rapport au salaire de référence est maintenant bien ancrée dans ces pays, une personne étant considérée au marché entre 80% et 120% : autant donner un coup de pouce à une femme en dessous de son marché ou entre 80% et 100% est facilement accepté, autant cela devient plus difficile à défendre lorsqu’elle affiche un positionnement individuel de 115% par exemple. L’analyse reste encore à affiner, la comparaison des salaires moyens entre groupes étant assez « grossière ». Pourquoi augmenter plus une femme à 105% sans s’occuper d’un homme du même groupe à 81% ? On sent la nécessité d’un mode d’emploi prenant en compte les positionnements individuels. De plus une différence de salaire moyen entre hommes et femmes dans un pays peut recouvrir des situations très variables d’une entité à l’autre dans le même pays. Mais au-delà des résultats chiffrés, l’exercice a eu l’intérêt de mettre en avant la nécessité d’actions spécifiques pour l’équité salariale, et d’aider à la prise de conscience des acteurs, ce qui est extrêmement positif.[1] L’article L2242-5 du Code du Travail impose aux entreprises de plus de 50 salariés d’engager chaque année une négociation sur les objectifs d’égalité professionnelle entre les femmes et les hommes.
[2] Les études produites dans la presse font habituellement état d’écarts femmes/hommes de plus de 20% et comparent des cas qui ne sont pas nécessairement représentatifs des situations rencontrées dans les entreprises étudiées.
[3] Nelder J.A. & Wedderburn R.W.M. Generalized linear models. Journal of the Royal Statistical Society A 135:370-384 ; 1972.
[4] Breiman L, Friedman JH, Olshen RA, Stone CJ. Classification And Regression Trees. CRC Press; 1984. Breiman L. Random forests. Machine Learning 2001, 45:5–32.
Aucun commentaire
Vous devez être connecté pour laisser un commentaire. Connectez-vous.