Kyberbezpečnosť: Umelá inteligencia pomáha ľuďom, ale aj kyberzločincom

0

Špeciálny projekt

Objem údajov kolujúcich internetom každým rokom exponenciálne rastie, takže analyzovať ich v reálnom čase s cieľom odhaliť nebezpečné či nelegálne aktivity bolo veľmi náročné a v niektorých prípadoch prakticky nemožné. Až donedávna. Problém, ktorý rozvoj informačných technológií vytvoril, sa bude dať pomocou umelej inteligencie a strojového učenia aj vyriešiť.

Strojové učenie je založené na algoritmoch vykonávajúcich úlohy, na ktoré boli vytvorené, tak, že v obrovských množstvách dát identifikujú určité vzory. Na základe týchto vzorov vytvárajú a priebežne spresňujú model, podľa ktorého potom vykonávajú svoju činnosť, napríklad identifikáciu škodlivého kódu. Inak povedané, v minulosti boli počítače schopné fungovať tak, ako boli naprogramované, vykonávať program presne krok za krokom. Keď bolo treba niečo zmeniť alebo zlepšiť, musel sa program aktualizovať. Strojové učenie umožňuje, aby sa algoritmy priebežne učili, tak ako to robia ľudia. Takýmto spôsobom získajú „vedomosti‟, ktoré sú založené na minulých skúsenostiach, a v konečnom dôsledku vykonávajú úlohy, na ktoré boli vytvorené, rýchlejšie a efektívnejšie.

Algoritmy strojového učenia využívate aj vo svojich smartfónoch, napríklad pri rozpoznávaní obrazu. Aby sme boli presní, v smartfóne je len model na rozpoznávanie, ktorý bol vytvorený v cloudovej službe analýzou mnoho tisíc či miliónov obrázkov s podobným motívom. Aj vami odfotený obrázok bude poslaný do cloudu a možno prispeje k zlepšeniu modelu rozpoznávania. Alebo iný príklad. Určite ste si všimli, že reklamy, ktoré sa vám zobrazujú, sú cielené a personalizované. Je za tým práve strojové učenie. Na základe analýz vašich doterajších aktivít na nete sú vám ponúkané produkty a služby, ktoré by vás mohli zaujímať. Aj sociálne siete sú naprogramované tak, aby vám zobrazovali príspevky, ktoré sú prispôsobené vašim záujmom a vášmu minulému správaniu na týchto platformách. Žiaľ, strojové učenie nevyužívajú len firmy, ktoré sa zaoberajú kybernetickou bezpečnosťou, ale aj kriminálnici.

Modely strojového učenia inšpirované ľudským mozgom sa označujú aj ako hĺbkové učenie (angl. deep learning). Práve tieto modely sa ukázali najúčinnejšie pri spracúvaní obrovských množín sekvenčných dát. Hĺbkové učenie prinieslo výrazné zlepšenia v oblasti kybernetickej bezpečnosti, predovšetkým v detekčných schopnostiach, kde došlo k obrovskému posunu, ktorý by sa dal prirovnať k pozeraniu sa na vysokokvalitný videozáznam v porovnaní s pohľadom na statickú fotografiu.

No na úrovni súčasných technológií nemožno vytvoriť inteligentný a sebestačný počítač, ktorý sa dokáže samostatne učiť výlučne na základe vstupných informácií z prostredia a bez zapojenia človeka. Takže aj keď v kybernetickej bezpečnosti sú algoritmy strojového učenia veľkým pomocníkom, zatiaľ nie je k dispozícii riešenie, ktoré by bolo autonómne a učilo sa bez zapojenia človeka. Zatiaľ. Nie je však vylúčené, že v budúcnosti, možno blízkej, možno vzdialenejšej, také riešenia budú vytvorené.

Chirurg s dvadsaťročnou praxou si poradí so zložitejšou operáciou oveľa lepšie ako začínajúci lekár, pretože má dlhoročnú prax, priebežne študuje a získava nové poznatky. Rovnako to funguje aj pri strojovom učení. Medzi hlavné kritériá úspechu patrí množstvo údajov, na ktorých sa algoritmy učia, a čas, ktorý majú k dispozícii. Detekčné jadro spoločnosti ESET využíva strojové učenie už viac než 20 rokov a tomu zodpovedá aj nazhromaždený objem vedomostí. Tie sa potom využívajú hlavne pri triedení a analýze vzoriek, identifikácii podobností, ako aj stanovení hodnoty pravdepodobnosti pre spracúvaný objekt, ktorý sa následne zaradí do jednej z troch hlavných kategórií: škodlivý, potenciálne nechcený alebo bezpečný.

Ak je cieľom dosiahnuť čo najlepšie výsledky, treba využiť ľudskú odbornosť a technológiu trénovať na rozsiahlej množine správne identifikovaných škodlivých a bezpečných vzoriek, na základe ktorej sa algoritmus naučí vzorky rozlišovať. Tento spôsob tréningu pod dohľadom odborníkov sa nazýva strojové učenie s učiteľom (supervised learning). Počas tohto „tréningového“ procesu sa algoritmus učí, ako analyzovať a identifikovať väčšinu potenciálnych hrozieb a ako aktívne reagovať s cieľom eliminovať tieto hrozby. Algoritmy, ktoré pracujú samostatne, bez učiteľa (unsupervised learning), sa používajú napríklad na hľadanie podobností a anomálií v množstve dát, ktoré by ľudskému oku inak mohli uniknúť. Zároveň sa však algoritmus nemusí nevyhnutne naučiť oddeliť dobré od zlého, respektíve neškodné vzorky od tých škodlivých. Tieto algoritmy nájdu využitie pri práci s veľkým objemom označených vzoriek, kde pomôžu dáta rozdeliť do skupín, aby sa následne mohli vytvoriť menšie tréningové množiny pre ostatné algoritmy. 

Ďalšia možnosť je kombinácia strojového učenia s učiteľom a bez učiteľa. Pri trénovaní algoritmu sa v tomto prípade používajú len čiastočne označené dáta, pričom výsledky následne odborníci kontrolujú a dolaďujú, až kým sa nedosiahne požadovaná úroveň presnosti. Na podobnom princípe funguje aj jadro strojového učenia spoločnosti ESET, nazvané Augur. Využíva sa na klasifikáciu položiek, ktoré neboli súčasťou tréningovej množiny a neboli predtým označené.

Ako už bolo spomenuté, strojové učenie využívajú aj tvorcovia škodlivého kódu. Už v roku 2003 trójsky kôň Swizzor použil automatizáciu, pri ktorej bol škodlivý kód každú minútu nanovo zabalený a každá obeť tak dostala variant daného malvéru v pozmenenej podobe, čo sťažilo jeho detekciu a umožnilo rozsiahle šírenie. Moderné antimalvérové riešenia by si s takýmto postupom dokázali hravo poradiť.

Existuje však veľa sofistikovanejších scenárov, ako by mohli kybernetickí zločinci využiť strojové učenie v budúcnosti. Napríklad profilovanie obetí na základe verejne dostupných a zozbieraných dát či vytváranie falošných príznakov odkazujúcich na iný malvér s cieľom zmiasť výskumníkov. Zlepšujú sa aj metódy posielania spamu, aby nebol zachytený antispamovým filtrom, hlavne čo sa týka textov e-mailov bez gramatických a syntaktických chýb. Absencia takýchto chýb však nie je záruka toho, že ide o pravdivú správu. Najmä dnes, keď kybernetickí zločinci nevyužívajú len služby profesionálnych prekladateľov, ale aj strojové učenie – napríklad v podobe bežne dostupných prekladových služieb, ktoré výrazne zlepšili lokalizácie zdrojových textov.

Pomocou algoritmu strojového učenia a dostupných dát by mohli útočníci phishingové e-maily aj automaticky alebo čiastočne prispôsobiť obeti, napríklad podľa jej jazyka, záujmov, sledovaných tém a noviniek, prípadne akýchkoľvek iných kritérií, pre ktoré získajú vhodné tréningové dáta. Personalizácia obsahu pritom predstavuje výrazne vyššie riziko, pretože zvyšuje šancu, že obeť e-mail otvorí.

Budúcnosť ešte len ukáže, či sa tieto obavy skutočne splnia a do akej miery. Nie je jednoduché povedať, či budú nakoniec prevládať pozitívne alebo negatívne vplyvy technológií, ako je strojové učenie. No už dnes môžeme na oboch póloch vidieť nepopierateľný nárast systémov, ktoré nezvratne menia bezpečnosť celého internetu.

Viac zaujímavých informácií o IT bezpečnosti sa dočítate na webe bezpecnenanete.sk, kde sa nielen tejto téme venujú podrobnejšie odborníci z ESETu.

Zdroj: www.bezpecnenanete.sk

 

Ľuboslav Lacko

Všetky autorove články
ESET kyberbezpecnost security bezpečnosť umelá inteligencia

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať