Ecole d'ingénieur et centre de recherche en télécommunications

Jelena ISACHENKOVA

Jelena ISACHENKOVA
Jelena ISACHENKOVA
Eurecom - Réseaux et Sécurité 
Doctorant ( 2009 - 2013)
Alumni EURECOM

Thèse

Analyse de Campagnes massives de courrier électronique collectées grâce à un filtre anti-spam basé sur le principe de défi-réponse

Responsable(s)

 

Le commerce du spam a démarré en 2002, et devenu un phénomène massif, couvrant 72% du trafic d’e-mail en 2004 et atteint son pic en 2010 quand 89% des emails étaient du spam. Aujourd’hui la boîte mail des utilisateurs a également commencé à recevoir de grandes quantités d’autres types d’emails en vrac. Selon les rapports d’Hotmail publié en 2012, les bulletins d’informations et les notifications automatiques de message constitue plus de 50% des messages reçus. Toutefois, pour les filtres d’anti-spam classiques, il est difficile de différencier les emails sollicités et non sollicités dans les emails en vrac. Par conséquent, alors que la plupart des recherches existantes étudient  l’efficacité des techniques d’anti-spam, cette thèse se focalise sur les quelques cas où les techniques existantes échouent. Nous limitons notre étude à la zone souvent négligée des emails gris, c'est-à-dire, les messages ambigus qui ne peuvent pas être clairement catégorisés d’une manière ou d’une autre par les filtres anti-spam. Nous abordons l’étude de la zone grise comme des emails en vrac, en mettant l’accent sur l’analyse des campagnes e-mail. Nous proposons une approche en 3 étapes basée sur la clusteurisation des messages, classification et un raffinement basé sur des graphes ne contenant uniquement des entêtes d’emails. 

Au cours de l’étude de la zone grise, nous avons identifié trois catégories de campagne d’emails – commerciales, newsletter et botnet pour lesquels notre méthode de classification fonctionne bien. Pour identifier les campagnes d’escroqueries 419, une méthode de fraude avancée se basant principalement sur la confiance, nous proposons une nouvelle méthode basée sur les numéros de téléphones.  Nous avons poursuivi dans cette direction afin d’identifier et de caractériser les campagnes d’escroqueries 419 en décrivant plusieurs cas qui démontrent la diversité de ces campagnes et de leurs répartitions géographiques internationales.