คอมพิวเตอร์วิทัศน์และการเรียนรู้เชิงลึกเป็นวิธีใหม่ในการตรวจจับภัยคุกคามทางไซเบอร์

Transform Technology Summits เริ่มต้นวันที่ 13 ตุลาคมด้วย Low-Code/No Code: เปิดใช้งาน Enterprise Agility สมัครตอนนี้!
ทศวรรษที่ผ่านมามีความสนใจในการเรียนรู้เชิงลึก เพิ่มมากขึ้น ถูกกระตุ้นโดยความสามารถที่พิสูจน์แล้วของโครงข่ายประสาทเทียมในงานคอมพิวเตอร์วิทัศน์ หากคุณฝึกโครงข่ายประสาทเทียมด้วยภาพถ่ายแมวและสุนัขที่มีป้ายกำกับเพียงพอ จะสามารถค้นหารูปแบบที่เกิดซ้ำในแต่ละหมวดหมู่และจำแนกภาพที่มองไม่เห็นได้อย่างแม่นยำ
อะไร คุณสามารถใช้ตัวแยกประเภทรูปภาพทำอย่างอื่นได้ไหม
ในปี 2019 กลุ่มนักวิจัยด้านความปลอดภัยทางไซเบอร์สงสัยว่าพวกเขาสามารถจัดการการตรวจจับภัยคุกคามความปลอดภัยเป็นปัญหาการจำแนกรูปภาพได้หรือไม่ สัญชาตญาณของพวกเขาได้รับการพิสูจน์แล้วว่าอยู่ในตำแหน่งที่ดี และพวกเขาสามารถสร้างโมเดลการเรียนรู้ของเครื่องที่สามารถตรวจจับมัลแวร์ตามรูปภาพที่สร้างจากเนื้อหาของไฟล์แอปพลิเคชันได้ อีกหนึ่งปีต่อมา เทคนิคเดียวกันนี้ถูกใช้ในการพัฒนาระบบการเรียนรู้ของเครื่องที่ ตรวจพบเว็บไซต์ฟิชชิ่ง
การผสมผสานระหว่างการสร้างภาพข้อมูลไบนารีและการเรียนรู้ของเครื่องเป็นเทคนิคอันทรงพลังที่สามารถให้แนวทางแก้ไขปัญหาแบบเก่าได้ มันกำลังแสดงสัญญาในการรักษาความปลอดภัยทางไซเบอร์ แต่ก็สามารถนำไปใช้กับโดเมนอื่น ๆ ได้ การตรวจจับมัลแวร์ด้วยการเรียนรู้เชิงลึก
วิธีดั้งเดิมในการตรวจหามัลแวร์คือการค้นหาไฟล์สำหรับลายเซ็นที่ทราบของเพย์โหลดที่เป็นอันตราย ตัวตรวจจับมัลแวร์จะรักษาฐานข้อมูลของคำจำกัดความของไวรัสซึ่งรวมถึงลำดับ opcode หรือข้อมูลโค้ด และค้นหาไฟล์ใหม่เพื่อดูว่ามีลายเซ็นเหล่านี้อยู่หรือไม่ น่าเสียดายที่นักพัฒนามัลแวร์สามารถหลีกเลี่ยงวิธีการตรวจจับดังกล่าวได้อย่างง่ายดายโดยใช้เทคนิคต่างๆ เช่น การทำให้โค้ดสับสนหรือใช้เทคนิคความหลากหลายในการกลายพันธุ์ของโค้ดในขณะใช้งานจริง
เครื่องมือวิเคราะห์แบบไดนามิกพยายามตรวจจับ พฤติกรรมที่เป็นอันตรายระหว่างรันไทม์ แต่จะช้าและต้องมีการตั้งค่าสภาพแวดล้อมแบบแซนด์บ็อกซ์เพื่อทดสอบโปรแกรมที่น่าสงสัย
ในช่วงไม่กี่ปีที่ผ่านมานักวิจัยได้ลองใช้ เทคนิคการเรียนรู้ของเครื่อง เพื่อตรวจจับมัลแวร์ โมเดล ML เหล่านี้สามารถจัดการกับความท้าทายบางอย่างในการตรวจจับมัลแวร์ได้ รวมถึงการสับสนของโค้ด แต่พวกเขานำเสนอความท้าทายใหม่ ๆ รวมถึงความจำเป็นในการเรียนรู้คุณสมบัติมากเกินไปและสภาพแวดล้อมเสมือนจริงในการวิเคราะห์ตัวอย่างเป้าหมาย
การสร้างภาพไบนารีสามารถกำหนดการตรวจจับมัลแวร์ใหม่โดยเปลี่ยนเป็น ปัญหาการมองเห็นคอมพิวเตอร์ ในวิธีการนี้ ไฟล์จะถูกเรียกใช้ผ่านอัลกอริธึมที่แปลงค่าไบนารีและ ASCII เป็นรหัสสี
ใน กระดาษที่ตีพิมพ์ในปี 2019 นักวิจัยจาก University of Plymouth และ University of Peloponnese แสดงให้เห็นว่าเมื่อเห็นภาพไฟล์ที่ไม่เป็นอันตรายและเป็นอันตรายโดยใช้วิธีนี้ รูปแบบใหม่ๆ ก็ปรากฏขึ้นที่แยกอันตรายและปลอดภัย ไฟล์. ความแตกต่างเหล่านี้จะไม่มีใครสังเกตเห็นโดยใช้วิธีการตรวจหามัลแวร์แบบคลาสสิก
ด้านบน: เมื่อเนื้อหาของไฟล์ไบนารีถูกแสดงเป็นภาพ รูปแบบต่างๆ จะปรากฏขึ้น ที่แยกมัลแวร์ออกจากไฟล์ที่ปลอดภัย
จากรายงานระบุว่า “ไฟล์ที่เป็นอันตรายมักจะรวมถึงอักขระ ASCII ประเภทต่างๆ นำเสนอภาพที่มีสีสัน ในขณะที่ไฟล์ที่ไม่เป็นอันตรายจะมี ภาพที่สะอาดขึ้นและการกระจายของค่า”
เมื่อคุณมีรูปแบบที่ตรวจจับได้ดังกล่าว คุณสามารถฝึก โครงข่ายประสาทเทียม
นักวิจัยจึงใช้ภาพเหล่านี้ในการฝึกโครงข่ายประสาทลักษณนาม สถาปัตยกรรมที่พวกเขาใช้คือโครงข่ายประสาทเทียมแบบเพิ่มหน่วย (SOINN) ที่จัดตัวเองได้ ซึ่งรวดเร็วและดีเป็นพิเศษในการจัดการกับข้อมูลที่มีเสียงดัง พวกเขายังใช้เทคนิคการประมวลผลภาพล่วงหน้าเพื่อลดขนาดภาพไบนารีเป็นเวกเตอร์คุณสมบัติขนาด 1,024 ซึ่งทำให้การเรียนรู้รูปแบบในข้อมูลอินพุตง่ายขึ้นและมีประสิทธิภาพในการคำนวณ
ด้านบน: สถาปัตยกรรมของระบบการเรียนรู้เชิงลึกที่ตรวจจับมัลแวร์จากการสร้างภาพไบนารี .