Neuronale Netze sind die treibende Kraft im Bereich des Machine Learnings und zeigen sich für eine Vielzahl an Erfolgen in den unterschiedlichsten Anwendungsgebieten verantwortlich. MAL2 beabsichtigt Deep Neural Networks und Unsupervised Learning zur automatisierten Detektion von a) betrügerischen Fake-Shops und b) schädlichen Android Apps (PHAs) einzusetzen und somit zur Verbesserung der Cyberkriminalitätsprävention beizutragen.
Online-Shopping ist alltäglich geworden, bereits 61,6% der Österreicher nutzen diese Form des Einkaufens. Der Umsatz der umsatzreichsten 250 Onlineshops in Österreich lag 2016 bei 2,3 Milliarden Euro, was einem Wachstum von rund 9 Prozent gegenüber dem Vorjahr entspricht. Kunden durch betrügerische Online Shops ‚abzuzocken‘ ist ein rasant wachsendes Cyberkriminalitätsdelikt. Seit Juli 2013 leistet der Internet Ombudsmann (ÖIAT) Aufklärungsarbeit und trägt mit einer Blacklist auf dem Portal "Watchlist Internet" zur Prävention bei. Betrügerische Online-Shops zu entlarven ist eine zeitintensive Aufgabe und erfordert vor allem großen manuellen Aufwand, da oft Dutzende oder mehr dieser Kopien zur gleichzeitig existieren. Jede Woche werden über 150 neue gefälschte Online-Shops zur manuellen Verifizierung eingereicht.
MAL2 erarbeitet eine Lösung zur Klassifizierung von Fake-Shops auf Basis von strukturellen Ähnlichkeitsmerkmalen und ermöglicht somit Cybersquatting durch Machine Learning zu erkennen. Mit über 2 Milliarden aktiven Geräten pro Monat (Tablets, Smartphones, etc.) ist Android das weltweit weitverbreitetste Betriebssystem für Mobilgeräte. Alleine 2016 wurden vier Millionen neue Malware-Programme für diese Plattform veröffentlicht. Der Marktanteil von Exploits, gemessen über alle Plattformen hinweg, beträgt 21% - Android ist somit die zweihäufigste adressierte Plattform für Exploit-Angriffe. Im vierten Quartal 2016 hatten 0,71% aller Geräte Schadsoftware (PHAs) installiert.
Ziel des MAL2 Projekts ist es, ein künstliches neuronales Netz zu trainieren, und die Möglichkeiten der Erkennung aufkommender Angriffsmuster und deren Nachvollziehbarkeit zu evaluieren. Ein Referenzdatensatz betrügerischer Fake-Shops ist bislang inexistent. Da die Aussagekraft neuronaler Netze stark von der Qualität der zugrundeliegenden Trainingsdaten, sowie der Wahl der geeigneten Granularität der extrahierten Merkmale abhängt, wird MAL2, zum Training der Modelle, Ground-Truth-Datensätze in beiden Anwendungsgebieten erarbeiten und veröffentlichen.
Ziel des MAL2 Projektes ist es (i) ein Open-Source-Framework zu entwickeln, welches funktionelle Unterstützung in der Datenextraktion, Featureerstellung, dem Training der NNs sowie Analyse der Ergebnisse ermöglicht (ii) eine performante Ausführung der Komponenten auf Hadoop und GPU-Clustern ermöglicht und (iii) sowie die Referenzdatensätze, die extrahierten Features sowie die trainierten NNs in beiden Anwendungsdomänen zu veröffentlichen.
Das Projekt MAL2 wird unterstützt durch finanzielle Mittel des Fördergebers BMVIT in IKT der Zukunft 6. Ausschreibung der FFG.