Collecte de données
Ce module présente des techniques et outils pour l'extraction et la collecte de données en sources ouvertes.
2. Introduction à quelques outils gratuits
Quand on débute en OSINT, on pourrait croire que seules des plateformes onéreuses permettent d’atteindre un niveau professionnel.
👉 Faux. Il existe aujourd’hui une galaxie d’outils gratuits — ou en version Community — qui permettent d’obtenir d’excellents résultats.
Le praticien OSINT avisé sait choisir ses outils :
-
en fonction de la tâche,
-
en fonction de la cible,
-
en fonction de ses contraintes éthiques et légales.
Ce chapitre vous présente quelques indispensables, qui vous permettront déjà de réaliser des enquêtes OSINT profondes et méthodiques.
Pourquoi utiliser des outils dédiés ?
-
Gagner en efficacité → automatiser ce qui serait trop long manuellement.
-
Explorer plus loin → certaines connexions ne sont visibles que par analyse croisée.
-
Structurer l’information → bien visualiser un graphe de relations, un historique, une cartographie.
👉 Un bon outil ne remplace pas votre cerveau, mais il en démultiplie les capacités.
1️⃣ Web Scraper.io
Web Scraper.io est une extension Chrome permettant de configurer facilement des plans de scraping.
Avantages :
-
Interface conviviale → pas besoin de coder.
-
Permet de définir des "sitemaps" pour naviguer automatiquement.
-
Extraction de contenu structuré (textes, liens, images, tableaux).
Idéal pour :
-
Extraire des listings d’annuaires en ligne.
-
Collecter des listes de publications.
-
Automatiser la récupération de contenu répété sur plusieurs pages.
Limites :
-
Moins performant que des frameworks type Scrapy pour les sites très complexes ou très dynamiques.
-
Certaines protections anti-scraping peuvent bloquer l’outil.
Cas d’usage typique :
👉 Extraire une liste de conférenciers sur le site d’un événement, ou un annuaire professionnel public.
2️⃣ Maltego Community Edition (CE)
Maltego est un incontournable de l’OSINT pro.
Sa version Community gratuite (Maltego CE) est limitée en nombre de requêtes, mais suffisante pour beaucoup d’enquêtes.
Principales forces :
-
Cartographier les relations entre entités :
-
noms de personnes,
-
adresses email,
-
domaines,
-
adresses IP,
-
comptes de réseaux sociaux.
-
-
Visualisation sous forme de graphes interactifs :
-
Voir clairement les liens entre les différentes entités.
-
Enrichir les noeuds avec de nouvelles données.
-
-
Grande extensibilité grâce aux transforms → modules qui permettent d’interroger automatiquement des bases de données tierces.
Cas d’usage typique :
👉 Cartographier l’écosystème numérique d’une entreprise, à partir d’un simple nom de domaine.
3️⃣ SpiderFoot OSS
SpiderFoot est une plateforme d’automatisation massive de la collecte OSINT.
Deux versions :
-
SpiderFoot OSS → open source, à installer localement.
-
SpiderFoot HX → version en ligne (payante).
Même en OSS :
-
Permet de lancer des analyses complètes sur une entité (domaine, IP, pseudo, email, nom).
-
Explore automatiquement de nombreuses sources :
-
bases WHOIS,
-
historiques DNS,
-
fuites de données,
-
réseaux sociaux,
-
moteurs de recherche.
-
Particularité :
👉 SpiderFoot génère un rapport exhaustif et structuré, avec liens cliquables et évaluation des risques.
Cas d’usage typique :
👉 Réaliser un "profilage complet" d’un nom de domaine ou d’un alias en quelques minutes.
Bonnes pratiques dans l’usage des outils gratuits
1️⃣ Toujours commencer par comprendre ce que fait l’outil :
Un outil mal compris produit des faux positifs.
2️⃣ Ne pas en abuser :
Le fait qu’un outil soit "gratuit" ne signifie pas qu’il faille lancer des "scraps" agressifs.
3️⃣ Documenter vos recherches :
Gardez la traçabilité de ce que vous avez extrait, et comment.
4️⃣ Ne pas mélanger vie privée et enquêtes :
Utiliser des navigateurs / VM / comptes dédiés lors de l’utilisation de ces outils.
En synthèse
Les outils gratuits n’ont rien de "moins pro" — ce sont souvent les bases du kit OSINT du quotidien.
Ce qui fait la différence, c’est votre capacité à les utiliser intelligemment, avec rigueur et méthode.
"L’outil parfait n’existe pas. L’enquêteur avisé assemble les bons outils — et c’est cette boîte à outils qui fait sa force." 🧑💻🛠️