Machine Learning چیست؟ – بخش دوم

بدون دیدگاه
زمان مطالعه: 6 دقیقه
عملیات امنیت

به کارگیری یادگیری ماشین در یک محیط امنیتی: یک رویکرد علوم داده محور-بخش دوم

کاربرد یادگیری ماشین در تجزیه و تحلیل رفتار کاربران و موجودیت‌ها[۱] (UEBA)

تشخیص و پیش‌بینی تهدید بخشی حیاتی از امینت است که از یادگیری ماشین سود می‌برد. چالش‌های موجود در انجام UEBA را در نظر بگیرید. Gartner تجزیه و تحلیل رفتار کاربران و موجودیت‌ها را به صورت زیر تعریف می‌کند:

تجزیه و تحلیل رفتار کاربران و موجودیت‌ها

پروفایل‌سازی و تشخیص ناهنجاری بر اساس مجموعه‌ای از رویکردهای تحلیلی. در این راستا، به طور معمول از ترکیبی از روش‌های تحلیلی پایه (مانند قواعد به کارگیرنده امضاها، تطبیق الگو و آمارهای ساده) و روش‌های تحلیلی پیشرفته (مانند یادگیری ماشین با نظارت و فاقد نظارت) استفاده می‌شود. ارائه‌دهندگان از مجموعه‌ی تحلیل‌ها برای ارزیابی فعالیت کاربران و دیگر موجودیت‌ها (مانند Hostها، Applicationها، ترافیک شبکه و مخازن داده) برای کشف رویدادهای بالقوه استفاده می‌کنند.

UEBA یک کاربرد عالی برای یادگیری ماشین است. به دلایل زیر، یادگیری ماشین قادر است به طور ویژه UEBA را موثرتر کند:

یادگیری ماشین قادر است به حجم زیاد داده‌هایی که باید تجزیه و تحلیل شوند، رسیدگی کند. این مهم شامل توانایی ترکیب انواع مختلفی از داده‌ها (از الگوهای ترافیک شبکه و داده‌های Application تا رکوردهای مربوط به تلاش‌های احراز هویت کاربر و دسترسی کاربر به داده‌های حساس) است.
UEBA مبتنی بر یادگیری ماشین برای شناسایی تهدیدهای حائز شرایط (یعنی، تهدیدهای مشروع نیازمند اقدام) بسیار مناسب است. روش‌های یادگیری ماشین می‌توانند فاکتورهای بسیار بیشتری نسبت به آنچه قابل درنظر گرفتن توسط انسان‌ها در زمان نگاه به تهدیدهای بالقوه است، را تقریبا به صورت بلادرنگ در نظر بگیرند.
UEBA مبتنی بر یادگیری ماشین قادر به شناسایی تهدیدهایی است که به سختی قابل یافتن هستند. از جمله این تهدیدات می‌توان به تهدیدات داخلی، تصرف حساب‌های کاربری ممتاز و تهدیدهای ناشناخته با تشخیص تغییر رفتار اشاره کرد. یک سازمان می‌تواند از یادگیری ماشین برای شناسایی پویای دارایی‌های ارزشمند استفاده کند. UEBA ارتقایافته با یادگیری ماشین قادر است اطلاعات خطر را برای شناسایی فعالیت‌های جدیدی که با الگوهای موردانتظار در تضاد هستند (مانند اتصال ناگهانی یک کاربر سطح پایین به یک سیستم سطح بالا و انتقال حجم زیادی داده از آن به یک لپ‌تاپ)، به کار گیرد.

موارد کاربری UEBA برای یادگیری ماشین

بر اساس یک گزارش اخیر[۲]، در ۶۳ درصد از Data breachهای تایید شده، حمله‌کنندگان در پوشش کاربر قانونی (با استفاده از Credentialهای به سرقت رفته یا سوءاستفاده کاربران قانونی از دسترسی خود) بوده‌اند. برای تشخیص چنین تهدیدهایی، تکنولوژی شما باید ابتدا قادر به درک و ایجاد خط مبنای رفتار کاربران باشد و باید این کار را همزمان با کاهش هشدارهای اشتباه برای شناسایی موثر تهدیدات انجام دهد. این همان جایی است که یادگیری ماشین ارزش واقعی خود را با ایجاد الگو و رفتارهای خط مبدا[۳] و در ادامه تشخیص ناهنجاری‌ها با ترکیب مدل‌های آماری، الگوریتم‌های یادگیری ماشین و مجموعه‌ای از قواعد ارائه می‌کند. یک راه‌کار UEBA می‌تواند تبادلات ورودی را با پروفایل‌های خط مبدا موجود مقایسه کند. یادگیری ماشین می‌تواند در ادامه نتایجی تحلیلی برای برجسته کردن الگوهای دسترسی و کاربران نامجاز ارائه داده و به تیم اجازه دهد تا در صورت وجود نقض از طریق تصمیم‌گیری دستی یا فعالیت‌های خودکار اقدام کند.

مهم‌ترین موارد کاربری UEBA برای یادگیری ماشین عبارتند از:

Compromise شدن حساب کاربری
تهدیدات داخلی
سوءاستفاده از حساب‌های کاربری ممتاز
انتقال غیر مجاز داده

مشکلات احتمالی یادگیری ماشین

استفاده از یادگیری ماشین برای بهبود امنیت سازمان ایده بسیار خوبی است؛ اما برخی مشکلات احتمالی در این راستا وجود دارد که باید از آن‌ها آگاه بود. نحوه استفاده محصولات مختلف از یادگیری ماشین متفاوت بوده و همه به طور مناسب از این ابزارها استفاده نمی‌کنند. یک مصرف‌کننده آینده‌نگر، باید از مشکلات احتمالی آگاه بوده تا بتواند با پرسیدن سوالات مناسب از ارائه‌دهندگان قادر به تشخیص محصولاتی که به طور موثر از یادگیری ماشین استفاده می‌کنند، باشد.

برخی از مشکلات احتمالی عبارتند از:

داده‌های با کیفیت پایین: روش‌های یادگیری ماشین قادر به تبدیل ورودی‌های بد به خروجی‌های خوب نیستند. در نتیجه، راهکارهای امنیتی باید قادر به تبدیل سطح گسترده‌ای از داده‌های امنیتی به یک فرمت استاندارد باشد. علاوه‌براین، حتی یک فعالیت مشخص مشاهده شده توسط چندین سیستم (در برخی موارد سیستم‌های ارائه شده توسط یک ارائه‌کننده) می‌تواند توسط هر یک از آن‌ها به روشی کاملا متفاوت ثبت و جزئیات‌نگاری شده باشد. به همین دلیل وجود داده‌هایی با جزئیات کافی و نامتناقض برای تجزیه و تحلیل بسیار مهم است. در صورت عدم دسترسی به داده‌های غنی و ساختاریافته، نتایج استفاده از روش‌های یادگیری ماشین غیرقابل پیش‌بینی بوده و دستیابی به هوش مصنوعی ناممکن خواهد بود.
فقدان اطلاعات مفهومی[۵]: استفاده نکردن از اطلاعات مفهومی مناسب و تنها تکیه بر روش‌های یادگیری ماشین برای رصد رویدادهای امنیتی منجر به دستیابی به نتایجی ناصحیح و نامفید خواهد شد. با در نظر گرفتن اطلاعات مفهومی، درک خطر تغییر یافته و شفافیت بیشتری در ماهیت و شدت فعالیت‌ها به دست خواهد آمد. مثال‌هایی ساده از اطلاعات مفهومی مناسب عبارت است از:
- هدف یک سرور Application مورد هدف واقع شده.
- هویت کاربری که فعالیت مخرب انجام می‌دهد.
- اعتبار یک آدرس IP خارجی متصل شده به یکی از لپ‌تاپ‌های سازمان.

با استفاده مناسب از یادگیری ماشین، قادر به تزریق شکل‌های زیادی از اطلاعات مفهومی و استفاده از این اطلاعات در فرایند تجزیه و تحلیل و تصمیم‌گیری خواهیم بود. بصری‌سازی نیز لایه‌ای حیاتی در یادگیری ماشین است. یک رویکرد امنیتی مبتنی بر یادگیری ماشین باید قادر به بازنمایی صحیح تهدیدها بوده تا تحلیل‌گران ابزارها و دید لازم برای بررسی و پاسخ‌گویی به وقایع را در اختیار داشته باشند.

داده آموزش ناکافی: الگوریتم‌های یادگیری ماشینی نیازمند مقدار مناسبی از داده آموزش با کیفیت هستند. این داده‌ها نقشی کلیدی برای تشخیص دقیق تهدیدات ایفا می‌کنند و بدون آن‌ها، الگوریتم‌ها لزوما قادر به تمایز بین موارد خوب و بد و همچنین تشخیص اهمیت ناهنجاری‌ها نیستند.
شکست در تولید اطلاعات مفید: کیفیت یادگیری راهکار در درازمدت فاکتور مهم دیگری است که باید در نظر گرفت. آیا قابلیت یادگیری راهکار ادامه‌دار خواهد بود؟ آیا راهکار قابلیت سازگاری با تغییرات در محیط را داشته و پس از انجام تغییرات همچنان اطلاعات مفید و با کیفیت بالا در زمینه امنیت را تولید خواهد کرد؟ تنها استفاده یک محصول از یادگیری ماشین به معنی ارزش امنیتی آن محصول نبوده و تاثیرگذاری SOC را افزایش نمی‌دهد.
فقدان تمرکز بر ارزش یادگیری ماشین: در مواجهه با ارائه‌دهندگان محصولات امنیتی مبتنی بر یادگیری ماشین، اغلب آن‌ها به شدت در مورد الگوریتم‌های یادگیری ماشین مورد استفاده در محصول خود صحبت می‌کنند. اما این اطلاعات، علی‌رغم شگفت‌انگیز بودن، نشانه‌ای از عملکرد مناسب تکنولوژی نیستند. در حقیقت، الگوریتم‌ها مولفه نسبتا آسانی از یادگیری ماشین هستند. یک مصرف‌کننده آینده‌نگر باید بر ارزشی که محصول ارائه می‌کند، تمرکز کند. این ارزش با توجه به میزان بهبود زمان‌های تشخیص و پاسخ‌گویی سازمان پس از استفاده از این ابزارها اندازه‌گیری شود.

در صورت استفاده موثر، یادگیری ماشین به تیم شما در دستیابی به موارد زیر کمک می‌کند:

تشخیص تهدیدهای پنهان و هشدارهای اشتباه
سرعت‌بخشی به فرایند پاسخ‌گویی به وقایع
ساده کردن عملیات‌های SOC برای کاهش میانگین زمان تشخیص و پاسخ‌گویی به تهدیدات

نتیجه‌گیری: یادگیری ماشین می‌تواند سرعت، هوشمندی و کیفیت بالاتری را در دستیابی به امنیت ارائه کند.

با کاهش تلاش‌های انسانی و کاستن از زمان تشخیص، پاسخ‌گویی و بازیابی از وقایع، یادگیری ماشین نوید‌دهنده بهبودی چشم‌گیر در امنیت است. مهم‌ترین چالش‌ها در استفاده موفق از یادگیری ماشین برای امنیت عبارت است از:

دسترسی بلادرنگ روش‌های یادگیری ماشین به مجموعه داده‌هایی ساختاریافته و با کیفیت بالا از تمام رویدادهای مرتبط با امنیت در سراسر شرکت.
ارائه اطلاعات مفهومی لازم به یادگیری ماشین برای درک معنا و اهمیت هر فعالیت مشاهده شده و ناهنجاری تشخیص داده شده.
تهیه مجموعه‌هایی گسترده از داده‌های آموزش با کیفیت بسیار بالا برای آموزش فعالیت‌های خوب و بد به ماشین.

در صورتی که سازمان شما در حال تلاش برای حل مشکلات امنیتی موجود به واسطه کمبود منابع و هزینه‌های جریان کاری دستی و ناکارا است، یادگیری ماشین می‌تواند یک تکنولوژی مفید برای شما باشد. یادگیری ماشین می‌تواند به تحلیل‌گران شما اجازه دهد تا بر روی مسائلی که نیازمند بینش و خلاقیت هستند، تمرکز کنند. علاوه‌براین، به مقیاس‌پذیری عملیات‌های امنیت همانطور که تهدیدات تکامل می‌یابند کمک می‌کند.

در صورت استفاده موثر، یادگیری ماشین به تیم شما کمک می‌کند تا:

تهدیدات مخفی را تشخیص داده و از هشدارهای اشتباه بکاهید.
به فرایند پاسخ‌گویی به وقایع سرعت بخشید.
در راستای کاهش میانگین زمان تشخیص و پاسخ‌گویی به تهدیدات، به ساده‌سازی عملیات‌های امنیت بپردازید.

با این همه، یادگیری ماشین یک ابزار جادویی نیست و استفاده از آن منجر به حل همه مشکلات شما نخواهد شد. محدودیت‌ها و مشکلاتی در این زمینه وجود دارند که باید در زمان تحقیق در مورد یک راهکار امنیتی مبتنی بر یادگیری ماشین، از آن‌ها آگاه باشید.

[۱] User and Entity Behavior Analytics

[۲] Verizon Data Breach Incident Report

[۳] Baseline

[۴] Data exfiltration

[۵] Contextual information