DJENY MAINVIL ÉCONOMISTE & ANALYSTE DES AFFAIRES
Analyse exploratoire RH — Business Intelligence
Mandat · Analyse RH & BI

Analyse exploratoire RH et modélisation des effectifs

CONTEXTE

Ce travail s’inscrit dans le cadre d’une analyse exploratoire visant à démontrer la valeur qu’une solution de Business Intelligence peut apporter en utilisant des données RH extraites d’un système existant. Les données fournies représentent un échantillon de l’effectif de l’entreprise et incluent des informations relatives aux employés, aux départements et aux unités d’affaires.
L’objectif est d’analyser la structure réelle et la qualité des données, d’identifier ce qui est fiable d’un point de vue analytique et de produire des indicateurs concrets et exploitables, tout en respectant strictement les contraintes de confidentialité des données.

IMPORTATION ET NETTOYAGE DES DONNÉES

La première étape a consisté à nettoyer et à préparer les données afin d’en garantir la cohérence et la fiabilité pour l’analyse. Les types de données ont été standardisés, notamment pour les identifiants, les dates et les montants financiers, et des vérifications ont été effectuées pour repérer les lignes vides et les doublons exacts.
Les intitulés de poste ont été nettoyés et les incohérences typographiques ont été corrigées (par exemple, « Sr. Manger » a été remplacé par « Sr. Manager »). Les noms de colonnes techniques ont été renommés pour améliorer la lisibilité du modèle, et les informations sensibles telles que les noms complets des employés ont été supprimées conformément aux bonnes pratiques en matière de confidentialité des données.
Lors de l’analyse exploratoire, une attention particulière a été portée à la compréhension de la granularité des données. Il a été observé que différents employés peuvent partager le même EEID, ce qui signifie que l’EEID ne représente pas un identifiant unique d’employé, mais plutôt un identifiant au niveau de l’enregistrement.
Afin de déterminer précisément le nombre d’employés, une validation croisée des noms, de l’âge, du sexe et des dates d’embauche a été réalisée. Cette analyse a révélé des cas où des employés portant des noms identiques présentaient des caractéristiques démographiques et temporelles incompatibles avec l’hypothèse qu’il s’agissait de la même personne. Par exemple, des employés ayant le même nom pouvaient avoir des âges significativement différents et des années d’embauche très éloignées, ce qui exclut des scénarios tels que des réembauches ou des changements de poste internes.
Sur la base de ces observations, il a été conclu que, dans le cadre de ce jeu de données, chaque ligne représente un employé distinct. Cette conclusion repose sur des observations factuelles des données et est explicitement énoncée comme une hypothèse de travail pour le reste de l’analyse.

MODÉLISATION DES DONNÉES

Sur la base de cette compréhension, plusieurs colonnes calculées ont été créées afin d’enrichir le jeu de données sans introduire d’hypothèses risquées. Une colonne Statut a été ajoutée pour identifier si un employé est actif ou inactif, en fonction de la présence d’une date de départ. Une colonne Ancienneté (Années) a également été calculée pour mesurer la durée d’emploi, permettant ainsi d’analyser l’expérience globale de l’effectif.
De plus, une table Date dédiée a été créée pour soutenir l’analyse temporelle. Des relations ont ensuite été établies de manière simple et cohérente, liant la table principale des employés aux tables des départements, des unités d’affaires et des dates par le biais de leurs identifiants respectifs.
Ce modèle relationnel permet une navigation fluide entre les analyses et garantit que les indicateurs calculés peuvent être analysés de manière cohérente par département, unité d’affaires, pays ou toute autre dimension organisationnelle pertinente.
Du point de vue des calculs, seuls les indicateurs jugés fiables compte tenu des données disponibles ont été retenus. L’effectif total est calculé comme le nombre de lignes du jeu de données, conformément à l’hypothèse validée selon laquelle chaque ligne correspond à un employé distinct dans cet échantillon.
Des indicateurs agrégés tels que le salaire moyen, le pourcentage de prime moyen et l’ancienneté moyenne ont été calculés afin de fournir un aperçu concis et pertinent de la structure de rémunération de l’entreprise et de l’expérience de son effectif.

← Retour aux mandats