Έρευνα της Sophos X-Ops, η οποία παρουσιάστηκε στο Virus Bulletin 2024, αναδεικνύει τα πλεονεκτήματα της χρήσης «πολυτροπικής» Τεχνητής Νοημοσύνης (multimodal AI) στη διαβάθμιση της ανεπιθύμητης ηλεκτρονικής αλληλογραφίας (spam), των μηνυμάτων ηλεκτρονικού ψαρέματος (phishing) και του μη ασφαλούς Διαδικτυακού περιεχομένου.
Στο συνέδριο Virus Bulletin 2024, ο Younghoo Lee, επικεφαλής επιστήμονας δεδομένων της Sophos παρουσίασε μια εργασία που αναφέρεται στην έρευνα της SophosAI για την «πολυτροπική» Τεχνητή Νοημοσύνη (ένα σύστημα που ενσωματώνει διαφορετικούς τύπους δεδομένων σε ένα ενοποιημένο αναλυτικό πλαίσιο). Στην ομιλία του, ο κ. Younghoo Lee εμβάθυνε στη νέα εμπειρική έρευνα της ομάδας για την εφαρμογή της πολυτροπικής Τεχνητής Νοημοσύνης στον εντοπισμό της ανεπιθύμητης ηλεκτρονικής αλληλογραφίας (spam), των μηνυμάτων ηλεκτρονικού ψαρέματος (phishing) και του μη ασφαλούς Διαδικτυακού περιεχομένου.
Τι είναι η πολυτροπική Τεχνητή Νοημοσύνη;
Η πολυτροπική Τεχνητή Νοημοσύνη (multimodal AI) αποτελεί μια σημαντική εξέλιξη στον τομέα της Τεχνητής νοημοσύνης. Σε αντίθεση με την παραδοσιακή μονοσήμαντη ανάλυση, τα πολυτροπικά συστήματα μπορούν να επεξεργάζονται ταυτόχρονα πολλαπλές ροές πληροφοριών, συνθέτοντας δεδομένα από πολλαπλές πηγές.
Στο πλαίσιο της κυβερνοασφάλειας -και κυρίως όταν πρόκειται για τη διαβάθμιση απειλών- το παραπάνω είναι μια ισχυρή ικανότητα. Αντί το «κειμενικό» και το οπτικό περιεχόμενο να αναλύονται ξεχωριστά, ένα πολυτροπικό σύστημα μπορεί να επεξεργάζεται και τα δύο ταυτόχρονα «κατανοώντας» παράλληλα τις περίπλοκες σχέσεις μεταξύ τους.
Για παράδειγμα, στην ανίχνευση των μηνυμάτων ηλεκτρονικού ψαρέματος (phishing), η πολυτροπική Τεχνητή Νοημοσύνη εξετάζει τα γλωσσικά μοτίβα και το ύφος γραφής του κειμένου μαζί με την οπτική πιστότητα των λογοτύπων και των στοιχείων της επωνυμίας ενώ παράλληλα αναλύει τη σημασιολογική συνέπεια μεταξύ των κειμενικών και οπτικών παραγόντων. Χάρη σε αυτή την ολιστική προσέγγιση, το σύστημα είναι ικανό να εντοπίσει προηγμένες επιθέσεις που στα περισσότερα παραδοσιακά συστήματα περνούν απαρατήρητες καθώς οποιεσδήποτε ενέργειες μοιάζουν νομότυπες. Επιπλέον, η πολυτροπική Τεχνητή Νοημοσύνη έχει την ικανότητα να μαθαίνει από τους συσχετισμούς μεταξύ διαφορετικών τύπων δεδομένων και να προσαρμόζεται σε αυτούς, αναπτύσσοντας μία ικανότητα διάκρισης του νόμιμου περιεχομένου από το κακόβουλο σε πολλαπλές διαστάσεις.
Δυνατότητες
Στην έρευνά του, ο Younghoo Lee περιγράφει λεπτομερώς ορισμένες από τις δυνατότητες ανίχνευσης των πολυτροπικών συστημάτων Τεχνητής Νοημοσύνης:
Ανάλυση κειμένου και κατανόηση φυσικής γλώσσας
- Ανάλυση γλωσσικών μοτίβων, ύφους γραφής και ενδείξεων πλαισίου για τον εντοπισμό αποπειρών χειραγώγησης
- Ανίχνευση τακτικών κοινωνικής μηχανικής, όπως επινοήσεις κατεπείγοντος και ασυνήθιστα αιτήματα για ευαίσθητες πληροφορίες
- Διατήρηση μιας εξελισσόμενης βάσης δεδομένων με προσχήματα και αφηγήματα ηλεκτρονικού ψαρέματος
Οπτική νοημοσύνη και επαλήθευση επωνυμίας
- Σύγκριση λογοτύπων, εταιρικών στιλ και οπτικών διατάξεων με τα κανονικά/νόμιμα πρότυπα
- Ανίχνευση ανεπαίσθητων διαφορών σε χρώματα, γραμματοσειρές και διατάξεις μίας επωνυμίας
- Εξέταση μεταδεδομένων εικόνας και ψηφιακών υπογραφών
Προηγμένη ανάλυση ασφάλειας και διευθύνσεων URL
- Εντοπισμός παραπλανητικών τεχνικών, όπως οι επιθέσεις τυποδιανομής (typosquatting, η κατάληψη μία διεύθυνσης URL περιλαμβάνει ένα τυπογραφικό λάθος ή παραλλαγές μίας γνωστής επωνυμίας όπως gooogle.com) και ομόγραφων λέξεων
- Ανάλυση των σχέσεων μεταξύ του εμφανιζόμενου κειμένου του συνδέσμου και του πραγματικού προορισμού
- Ανίχνευση αποπειρών απόκρυψης κακόβουλων διευθύνσεων URL με στιλιστικά τεχνάσματα και τεχνικές μορφοποίησης
Μελέτη περίπτωσης: Ένα ψεύτικο μήνυμα ηλεκτρονικής αλληλογραφίας από την εταιρεία Costco
Η παρακάτω εικόνα είναι μια γνήσια απόπειρα ηλεκτρονικού «ψαρέματος», σχεδιασμένη για να ξεγελάσει τους παραλήπτες και να τους κάνει να νομίζουν ότι κέρδισαν κάποιο δώρο από την Costco. Το μήνυμα ηλεκτρονικού ταχυδρομείου δείχνει επίσημο, και διαθέτει μία απομίμηση του λογότυπου και της επωνυμίας της Costco.
Εικόνα 1: Στιγμιότυπο οθόνης ενός μηνύματος ηλεκτρονικού «ψαρέματος», δήθεν από την Costco
Η πολυτροπική Τεχνητή Νοημοσύνη μπορεί να εντοπίσει διάφορες ύποπτες πτυχές αυτού του μηνύματος ηλεκτρονικού ταχυδρομείου, συμπεριλαμβανομένων:
- Φράσεων που χρησιμοποιούνται για να προκαλέσουν την αίσθηση του κατεπείγοντος και της άμεσης δράσης
- Της διεύθυνσης ηλεκτρονικού ταχυδρομείου του αποστολέα που δεν ταιριάζει με νόμιμους τομείς
- Ασυνεπειών με λογότυπα και εικόνες
Ως αποτέλεσμα, το σύστημα αποδίδει υψηλή βαθμολογία στο μήνυμα ηλεκτρονικού ταχυδρομείου, επισημαίνοντας το ως ύποπτο.
Η SophosAI εφάρμοσε επίσης πολυτροπική Τεχνητή Νοημοσύνη σε ιστοσελίδες NSFW (not safe for work) που περιέχουν περιεχόμενο που σχετίζεται με τυχερά παιχνίδια, όπλα και άλλα. Όπως και με τη διαβάθμιση των μηνυμάτων ηλεκτρονικού «ψαρέματος», η ανίχνευση αξιοποιεί διάφορες δυνατότητες, συμπεριλαμβανομένης της αξιολόγησης λέξεων-κλειδιών και φράσεων (ανεξαρτήτως γλώσσας) και της ανάλυσης εικόνων και γραφικών.
Πειραματικά αποτελέσματα
Για να δοκιμάσει την αποτελεσματικότητα της πολυτροπικής Τεχνητής Νοημοσύνης σε σχέση με τα παραδοσιακά μοντέλα Μηχανικής Εκμάθησης, όπως το Random Forest και το XGBoost, η SophosAI διεξήγαγε μια σειρά εμπειρικών πειραμάτων. Τα πλήρη αποτελέσματα είναι διαθέσιμα στην έρευνα του Younghoo Lee και στην ομιλία του Virus Bulletin -αλλά εν συντομία, τα παραδοσιακά μοντέλα επέδειξαν καλή απόδοση κατά την ανίχνευση γνωστών απειλών και δυσκολεύτηκαν με νέα, άγνωστα μηνύματα ηλεκτρονικού ψαρέματος. Οι βαθμολογίες F1 (ένα μέτρο που εξισορροπεί την ακρίβεια και την ανάκληση για να δώσει μια συνολική «εικόνα» της ακρίβειας μεταξύ 0 και 1) ήταν μόλις 0,53 με τα άγνωστα δείγματα, φτάνοντας στο υψηλό 0,66. Αντίθετα, η πολυτροπική Τεχνητή Νοημοσύνη (χρησιμοποιώντας το GPT-4o) απέδωσε πολύ καλά στην ανίχνευση νέων αποπειρών ηλεκτρονικού ψαρέματος, επιτυγχάνοντας βαθμολογίες F1 έως και 0,97 ακόμη και σε άγνωστες επωνυμίες.
Παρομοίως και με το περιεχόμενο NSFW: τα παραδοσιακά μοντέλα πέτυχαν βαθμολογίες F1 γύρω στο 0,84-0,88, αλλά τα μοντέλα με ενσωματώσεις «multimodal AI» πέτυχαν βαθμολογίες έως και 0,96.
Συμπέρασμα
Το ψηφιακό τοπίο βρίσκεται σε φάση διαρκούς εξέλιξης φέρνοντας μαζί του μια σειρά από νέες απειλές -συμπεριλαμβανομένης της χρήσης της δημιουργικής Τεχνητής Νοημοσύνης για την εξαπάτηση των χρηστών. Τα μηνύματα ηλεκτρονικού «ψαρέματος» μιμούνται πλέον συστηματικά και σχολαστικά τις νόμιμες επικοινωνίες ενώ οι ιστοσελίδες NSFW κρύβουν επιβλαβές περιεχόμενο πίσω από παραπλανητικές εικόνες. Την ώρα που οι παραδοσιακές μέθοδοι κυβερνοασφάλειας παραμένουν σημαντικές, αποδεικνύονται πλέον ανεπαρκείς από μόνες τους. Η πολυτροπική Τεχνητή Νοημοσύνη παρέχει ένα καινοτόμο επίπεδο άμυνας που μας βοηθά να ενισχύσουμε την κατανόηση μας πάνω στο περιεχόμενο.
Με την αποτελεσματική ανίχνευση των εξελιγμένων μηνυμάτων ηλεκτρονικού «ψαρέματος» και με την ακριβή διαβάθμιση των ιστοσελίδων NSFW, η πολυτροπική Τεχνητή Νοημοσύνη όχι μόνο προστατεύει αποτελεσματικότερα τους χρήστες αλλά και προσαρμόζεται στις ανερχόμενες απειλές. Τα αποτελέσματα των πειραμάτων που παρουσίασε ο Younghoo Lee στην εργασία του υποδεικνύουν σημαντικές βελτιώσεις σε σχέση με τις παραδοσιακές μεθόδους.
Στο μέλλον, η ενσωμάτωση της πολυτροπικής Τεχνητής Νοημοσύνης στις στρατηγικές κυβερνοασφάλειας δεν θα είναι απλώς επωφελής αλλά ζωτικής σημασίας για τη διασφάλιση της προστασίας του ψηφιακού μας περιβάλλοντος εν μέσω της αυξανόμενης πολυπλοκότητας και των προηγμένων απειλών.
Για περισσότερες πληροφορίες, το πλήρες κείμενο της εργασίας του Younghoo Lee είναι διαθέσιμο εδώ. Η ομιλία του στο συνέδριο Virus Bulletin 2024 είναι διαθέσιμη εδώ (μαζί με τις διαφάνειες).
Πηγή: Sophos