<멀웨어 데이터 과학>, Joshua Saxe, Hillary Sanders (영진닷컴)

멀웨어(malware : 악성코드)는 컴퓨팅 파워가 강해지고 인터넷으로 네트워크 연결이 일상이 되면서 많은 수의 멀웨어가 새롭게 만들어지고 있으며 패킹이나 난독화를 통해 자신을 위장하는 방법도 다양하게 적용되고 있어 탐지와 분석에 많은 노력이 들어가고 있는 실정이다.

특히 최근의 멀웨어는 단순히 파괴적인 동작 만이 아니라 랜섬웨어와 같이 금전적 이익을 목표로 만들어지고 있는 조직적 범죄화 되고 있어 빠른 분석과 탐지가 이루어지지 않으면 많은 피해가 발생하게된다.

책에서 소개된 안티바이러스 테스트 사이트(https://www.av-test.org/en/statistics/malware/)에 오늘 현재 상황을 보면 등록된 멀웨어가 11억개가 넘고 한달평균 수백만개의 멀웨어가 새롭게 생산되고 있는 것으로 나타나고 있다.

 


이 책은 멀웨어 탐지에 현재의 데이터 과학이 어떻게 적용될 수 있는 지 보여주는 트레이닝 북이다. 데이터 과학 분야는 최근 우리에게 인공지능 기술로 알려진 분야로 이 책은 데이터 과학의 산물인 머신러닝과 딥러닝을 이용해 멀웨어 탐지가 가능하도록 구성하는 방법을 단계적으로 설명하고 있다.

머신러닝 기법을 이용해 무엇인가를 분석하고자 할때 제일 큰 어려움은 모델을 어떻게 설계해야 하는 것인가라는 문제다. 이 책에서는 그런 모델 설계에 필요한 과정을 멀웨어가 가장 많이 만들어지는 윈도우 환경을 기준으로 설명하고 실제로 연습해볼 수 있는 리눅스 기반의 가상환경도 같이 제공하고 있어서 초심자들도 어렵지 않게 접근해 볼 수 있을 것 같다.

물론 윈도우 실행파일 분석이나 멀웨어의 네트워크 분석과 같은 것들이 그 자체만으로도 복잡하고 난이도가 있는 일이라서 책의 소개처럼 간단히 익힐 수 있는 것은 아니지만 그런 기초 지식이 충분한 상황에서 이 책을 접한다면 나름 의미있는 성과를 얻어낼 수 있는 책이라는 생각이 들었다.

인공지능이 화두가 되고 나름 독학으로 공부하는 중인데 멀웨어를 대상으로 하는 이런 책을 접하게 되어 반가웠고 내가 대학원시절 연구했던 내용들이 자주 보여 더 재미있게 느껴지는 책이었다.

이 책의 말미에 보안 데이터 과학자로 살아가는 것에 대한 조언 중에서 결과에 대한 회의론적 시각이라는 말에서 많은 고민들이 느껴지는 순간이었다.

 

※ 이 글은 협찬받은 도서를 읽고 주관적으로 작성한 내용입니다.

 

Posted by 휘프노스
,