Agrégateur pour l'intranet de @ecolehetic. Récupère et formalise les données des étudiants et leur activité professionnelle pour des recherches en OSINT et de la visualisation de données.
 
 
Go to file
Raphael c26df6770c
Documentation
2019-03-20 14:51:20 +01:00
commands Export command 2019-02-27 17:02:17 +01:00
core/connect Code base 2019-02-15 18:48:55 +01:00
helpers jsonToCsv helper 2019-02-27 17:03:03 +01:00
scripts Investigation scripts 2019-03-20 12:39:14 +01:00
.gitignore refactor(git): ignore data folder 2019-03-18 12:03:29 +01:00
README.md Documentation 2019-03-20 14:51:20 +01:00
index.js jsonToCsv helper 2019-02-27 17:03:03 +01:00
package-lock.json Code base 2019-02-15 18:48:55 +01:00
package.json Code base 2019-02-15 18:48:55 +01:00

README.md

Agrégateur d'OSINT pour l'intranet d'HETIC.


A propos

Cet outil en ligne de commande permet de collecter les données de l'intranet d'HETIC et de constituer une base de données alternative permettant le listing et l'analyse des étudiants. Cela nous permet d'obtenir l'ensemble des étudiants de l'école, classés par promotion avec leur photo, nom, prénom, promotion, adresse email et dans certains cas le numéro de téléphone. En collectant les données des entreprises et leur fiche, nous sommes en mesure de créer un nuage de mots clés par entreprise, ce qui permet d'observer les différents secteurs dans lesquels travaillent ou ont travaillés les héticiens. Cette chronologie nous permet de procéder à cette analyse et de l'étudier dans le temps.

Les données collectés nous permettent aussi d'effectuer des investigations de masse sur tous les étudiants d'HETIC. Notamment pour trouver leurs profils sur les réseaux sociaux, ou encore vérifier si leurs adresse emails se trouvent dans des fuites de données. Le programme permet donc de collecter les données et de les exporter les données dans différents formats (json, csv).

Pourquoi ?

  • Parce que la data c'est de l'argent
  • Parce que l'OSINT c'est cool
  • Parce qu'il serait temps qu'HETIC mette en place une API (?)
  • Pour une conférence sur l'OSINT à HETIC ? 👀
  • Pour sensibiliser à la protection des données personnelles

Vue d'ensemble des données collectés

Jeu de données

Étudiants :

  • uid
  • lastName
  • heticEmail
  • email
  • phone
  • cursus
  • birthdate
  • picture
  • promotion
  • enterprise
  • country

Visualisation de données

  • Évolution du nombre d'étudiants dans chaque promotions
  • Moyenne d'âge dans chaque promotion
  • Évolution du nombre d'étudiants dans chaque secteur d'activité
  • Évolution du nombre d'étudiants dans chaque secteur d'activité par promotions
  • Répartition géographique des étudiants en entreprises toutes promotions confondues, puis évolution par promotions (heatmap)
  • Répartition des fournisseurs de boîtes mails (gmail, outlook, protonmail ...) pour chaque étudiant

Évolution du nombre d'étudiants dans chaque promotions (échantillon: Bachelor Web)

Investigations OSINT

  • Présence des adresses email personnelles dans les fuites de données
  • Présence des adresses email hetic.net dans les fuites de données
  • Profils Linkedin des étudiants

Recherche de profil Linkedin

Investigation OSINT sur des adresses email.

Installation

$ git clone https://github.com/sundowndev/hetic-console
$ npm install

Usage

Lancer le programme :

$ node index.js

Utilisez la commande help pour afficher les commandes disponibles :

help                      Display this help message
connect                   Log in to outils.hetic.net using email and password
disconnect                Log out from outils.hetic.net
status                    Check authentication status
pull                      Pull module data from outils.hetic.net
show <module>             Display modules list
export <type>             Export data to json or sql

Se connecter à l'intranet :

hconsole > connect

Récupérer les données :

hconsole > pull

Afficher le dataset students :

hconsole > show students

Exporter les données :

# Les données se trouveront dans le dossier data
hconsole > export json