
De lecteur curieux à enquêteur de données
Partant d’une lecture attentive des fichiers publics liés à Jeffrey Epstein, un ingénieur data est passé d’observateur à enquêteur : la répétition d’anomalies dans des documents l’a poussé à structurer l’information sous forme de réseau. Exemples précis : la lecture de journaux d’avions et de dossiers judiciaires a servi de déclencheur ; la constatation de noms récurrents sur des vols et dans des actes de propriété a motivé la modélisation. Points clés :
- Motivation : transformer des pages isolées en relations exploitables.
- Objectif : cartographier les liens entre personnes, lieux et événements.
- Approche : partir des sources publiques et les relier par des identifiants communs.
Collecte et nettoyage : assembler les pièces du puzzle
La robustesse d’un graphe dépend d’une collecte exhaustive et d’un nettoyage rigoureux. Exemples de sources utilisées : dossiers judiciaires, journaux de vols, registres fonciers, annuaires et archives médiatiques. Pour rendre ces données exploitables, l’ingénieur a appliqué des techniques de nettoyage et d’enrichissement. Points clés :
- Techniques : OCR pour numériser des documents, parsing pour extraire des entités, normalisation des noms et adresses.
- Défis : variations orthographiques, homonymie, données incomplètes.
- Exemple : transformer une entrée de vol manuscrite en identifiant structuré (nom, date, vol) qui devient un nœud utilisable.
Construire le graphe : nœuds, arêtes et résolution d’entités
Le cœur du travail est la modélisation : chaque personne, entreprise ou lieu devient un nœud ; chaque interaction (vol, paiement, rendez-vous) devient une arête. La résolution d’entités (entity resolution) est centrale pour éviter les faux positifs. Outils et exemples concrets :
- Outils : bases graphes (Neo4j), librairies (NetworkX), visualisation (Gephi).
- Modèle : nœuds = personnes, propriétés = dates/identifiants ; arêtes = relation (ex. « invité sur un vol ») avec pondération selon fréquence.
- Exemple : relier un nom sur un manifeste de vol à une adresse trouvée dans un acte de propriété via une correspondance d’alias et d’email.
Visualisation et analyses : révéler des structures cachées
Une fois le graphe construit, l’analyse permet de détecter des hubs, des communautés et des trajectoires temporelles. Méthodes et résultats observables : centralité pour repérer des acteurs fortement connectés, détection de communautés pour isoler groupes d’intérêts, analyses temporelles pour suivre les interactions. Exemples d’insights :
- Centralité : identifier des individus qui apparaissent fréquemment comme points de passage.
- Communautés : clusters révélant sous-réseaux potentiellement indépendants.
- Temporalité : corréler pics d’activité avec événements documentés (procédures judiciaires, déplacements).
Enjeux éthiques et juridiques : responsabilité d’un projet public
Travailler sur des sujets sensibles impose des garde-fous : vérifier les sources, protéger les victimes et éviter la diffamation. L’ingénieur doit concilier transparence et prudence. Bonnes pratiques et précautions :
- Vérification : croiser au moins deux sources indépendantes avant de publier une connexion.
- Protection : anonymiser les victimes et les informations non publiques.
- Collaboration : travailler avec des journalistes ou des avocats pour évaluer les risques juridiques.
Impact et perspectives : quand la data éclaire le journalisme et la justice
Les graphes de données peuvent amplifier les enquêtes journalistiques et orienter des investigations officielles, tout en ayant des limites liées à l’accès aux sources et à l’interprétation des corrélations. Exemples d’usage et pistes d’évolution :
- Usage : aider les journalistes à prioriser des pistes, fournir des visualisations pour exposés publics.
- Limites : corrélation ≠ preuve ; nécessité d’enquêtes complémentaires sur le terrain.
- Perspectives : améliorer l’interopérabilité des données, renforcer l’open source pour audits indépendants et affiner la résolution d’entité par apprentissage automatique.
En savoir plus sur L'ABESTIT
Subscribe to get the latest posts sent to your email.



