חמישה תנאים ללמידת מכונה באבטחת מידע

דרוג:

"למידת מכונה" הפכה למילת באזז שספקים רבים אוהבים להשתמש בה ולפזר אותה כסוג של קסם על פתרונות אבטחת המידע שלהם על מנת למכור יותר. אחת מהמשימות הקשות שצצו לאחרונה, היא לדעת להעריך נכון פתרונות מבוססי למידת מכונה ולסנן את המוץ מן התבן.
 
לא אתאר במאמר זה מהי למידת מכונה או מדוע אנחנו צריכים אותה (בשביל זה יש ויקיפדיה), אבל אציין כי הגישה ללמידת מכונה חייבת תמיד להיות מבוססת על מדע, שקיפות וולידציה. וכדי להפוך את החיים של כולנו למעט יותר קלים, ראו חמישה קריטריונים ברורים שיעזרו לכם לבחון את איכותם של הפתרונות בהקשר זה, ללא קשר לסוג האלגוריתם שנמצא בשימוש: 

1. שיעור זיהוי (Detection Rate) מול תוצאות חיוביות שגויות (false positive) – שעור זיהוי גבוה אינו בהכרח סמן להצלחה. אפשר להגיע לשיעור זיהוי של 100% בקלות רבה, על ידי "שכנוע" האלגוריתם כי כל קובץ שהוא סורק הינו זדוני. לכן, הערך החשוב באמת הוא שיעור התוצאות החיוביות השגויות. תוצאה חיובית שגויה משמעה בפועל מניעת שימוש בקבצים לגיטימיים שבטעות זוהו כזדוניים. המטרה היא כמובן להגיע לשיעור נמוך ככל האפשר של תוצאות חיוביות שגויות. בלמידת מכונה, ניתן לבחון זאת גראפית על ידי עקומת ROC (receiver operating characteristic curve) המתארת את יחס שעור הזיהוי אל מול התוצאות החיוביות השגויות. בקשו מהיצרנים לראות את גרף ה- ROC, ברגע זה ובעבר – יצרן שלא מוכן או לא יכול להראות לכם את הנתונים האלו, לא באמת יוכל להבטיח לכם כמה נוזקות הוא יצליח למנוע מלחדור לארגון.

2. עדכונים – למידת מכונה מאפשרת לפתרונות אבטחת המידע לזהות איומים שלא זוהו בעבר ולחסום אותם. למידת מכונה טובה אינה זקוקה לעדכונים רבים לאורך הדרך, שכן היא אכן לומדת לבד אודות איומים חדשים במשך זמן ארוך. פתרון טוב יראה תוצאות טובות בגרף ה- ROC למשך חודשים ולא רק למשך ימים או שבועות. פתרון שזקוק לעדכונים רבים ופתרון שהדיוק שלו מידרדר בין עדכון לעדכון, לא באמת מספק את הסחורה.

3. החלטות בזמן אמת – אם הסריקה וחיפוש אחר נוזקות ארוך יותר מהזמן שלוקח לנוזקה לעשות את העבודה המלוכלכת שלה, זכינו בפתרון מצוין בזיהוי אבל לא במניעה. אם אנחנו רוצים למנוע נוזקות, האלגוריתם של למידת המכונה צריך לדעת לפעול תוך אלפית השנייה, ולא תוך שניות או דקות. חשוב לבדוק האם האלגוריתם נכנס לפעולה בזמן אמת וכמה זמן לוקח לו לבצע החלטות. בנוסף, בדקו מה קורה לרמת הדיוק שלו כאשר המחשב נמצא במצב לא מקוון - פתרון למידת מכונה עם סט מידע שלא יתאים לנקודות הקצה שלכם, ייאלץ לעבוד עם חיבור ענני ויהיה גם איטי וגם לא אמין.

4. לימוד בעולם האמיתי – הביצועים של האלגוריתם תלויים רבות במידע שעליו התבסס הלימוד שלו. אם המידע אקדמי, ישן ולא רלוונטי, האלגוריתם לא יבצע עבודתו בצורה אמינה בקבצים של העולם האמיתי מחוץ למעבדה. בדקו מהו המידע שעליו מתבסס האלגוריתם, האם הוא ריאלי ומציאותי ומהו נפח המידע.

5. יכולת גידול – לצורך תהליך הלימוד של הפתרון, יש צורך ביכולת לאסוף מידע חדש בהיקפים גדולים, בין היתר קבצים לגיטימיים וקבצי נוזקות. יחד עם זאת, לא די באיסוף כמויות עצומות של מידע - המידע הולך ומתרבה לאורך זמן, ולכן הפתרון צריך להיות מסוגל ללמוד ולבחון מידע החדש שנאסף, בו בזמן שבסיס הנתונים והלימוד גדל באופן משמעותי, וזאת תוך שמירה על מהירות אחידה וגבוהה.
 
לסיכום, למידת מכונה היא ללא ספק "הדבר החם הבא" בעולם אבטחת המידע והמחשוב בכלל. קיימים פתרונות רבים בשוק שמצהירים כי הם מציעים יכולות אלו. לפני שבאים לבחון אותם, אל שכחו לשאול את השאלות הנכונות.
תגיות של המאמר: 

כתבות נוספות בקטגוריה הייטק וטכנולוגיה

NIQ חושפת את דו"ח מגמות הצרכנות בענף הטכנולוגיה לשנת 2025: היקף המכירות הגלובלי מגיע ל-1.29 טריליון דולר ‏NielsenIQ (NIQ), חברה מובילה למודיעין צרכנים, פרס
VeriSilicon משיקה את ISP9000: הדור הבא של ISP משובץ בינה מלאכותית ליישומי ראייה חכמה ‏VeriSilicon (688521.SH) חשפה היום את מעבד התמונה
ExaGrid ברשימת המועמדות הסופיות בקטגוריית פרסי האחסון 2025 ‏ExaGrid®, הספקית של הפתרון היחיד בענף לאחסון גיב
AI-Media משתפת פעולה עם AudioShake כדי לחולל מהפכה עבור שמע בשידורי ספורט חיים ותרגום קולי מבוסס בינה מלאכותית AI-Media, מובילה עולמית בפתרונות תרגום וכתוביות מב
Picus Security מכריזה כי זכתה להכרה ב-Gartner® Market Guide לאימות חשיפה של יריבים Picus Security, חברת אימות האבטחה המובילה, הודיעה
Movellus ו-SEAKR Engineering של RTX משתפות פעולה לקידום ייצור ASIC קריטי למשימה Movellus הודיעה היום ש-SEAKR Engineering, LLC מבית
VeriSilicon מציגה את AcuityPercept: מערכת ISP אוטומטית המופעלת על ידי בינה מלאכותית ‏VeriSilicon (688521.SH) הכריזה על AcuityPercept,
BYD Energy Storage משיקה את Chess Plus עבור אחסון אנרגיה מסחרי ותעשייתי בסין BYD Energy Storage, חטיבה עסקית של BYD Company Lim
LEXI Voice מגיע: AI-Media משיקה תרגום קולי פורץ דרך מבוסס בינה מלאכותית ב-NAB 2025 AI-Media, מובילה עולמית בפתרונות תרגום וכתוביות מב
ExaGrid ברשימת המועמדות הסופיות לפרסי האחסון 2025 ‏ExaGrid® , הספקית של הפתרון היחיד בענף לאחסון גיב
Lantronix משיקה מערכת על מודול Open-Q 8550CS חדשה שנועדה לספק מענה לצרכים של מחשוב בינה מלאכותית בקצה Lantronix Inc. לנטרוניקס (נאסד"ק: LTRX), מובילה עו
Xsolla מרחיבה את מחויבותה לפיתוח משחקי וידאו באמריקה הלטינית עם התוכנית Journey of Indies (JOIN) Xsolla, מובילה עולמית העוסקת בסחר במשחקי וידאו, גא
Xsight Labs מחוללת מפכה בשוק מתגי האתרנט עם ארכיטקטורה פתוחה ראשונה מסוגה Xsight Labs, חברה מובילה לתכנון ושיווק של מוליכים
ExaGrid זכתה לכבוד בהופעתה במדריך תוכניות השותפים של CRN®  לשנת 2025 ‏ExaGrid® , הספקית של הפתרון היחיד בענף לאחסון גיב
MDS Global מבטיחה שותפות אסטרטגית עם PlatformX Communications (PXC) MDS Global, ספקית מובילה של מערכות תמיכה עסקיות (B
מהפכני: לשוחח עם דמות NSFW של חברה מבוססת בינה מלאכותית בעת שהביטויים לשימוש בבינה מלאכותית ממשיכים להשתנו
DEXIS תציג חידושים פורצי דרך ב-IDS 2025 DEXIS, המובילה העולמית בטכנולוגיות הדמיה דנטלית, נ
Bitget Wallet מציגה את Super DEX, חוויית עסקאות החלף משודרגת Bitget Wallet, אפליקציית ארנק ה-Web3 ללא משמורת המ
GA-ASI השיגה אישור EMAR/FR 145 לארגוני תחזוקה עבור הפלטפורמות MQ-9A ו-MQ-9B General Atomics Aeronautical Systems, Inc (GA-ASI)
Quantexa הבטיחה מקום בין עשר החברות המובילות בדירוג Financial Crime and Compliance 50 של Chartis לשנות 2025 Quantexa, ספקית מובילה בפתרונות מודיעין לקבלת החלט
הוסף תגובה 
תגובות  ( תגובות)