20 באוגוסט 2022
למידה עמוקה היא תת-קבוצה של למידת מכונה (ML), שבה רשתות עצביות מלאכותיות - אלגוריתמים שעובדים כמו המוח האנושי - לומדים מכמויות גדולות של נתונים.
למידה עמוקה מופעלת על ידי שכבות של רשתות עצביות, שהן אלגוריתמים שמודלים באופן רופף לפי האופן שבו המוח האנושי עובד. אימון עם כמויות גדולות של נתונים הוא מה שמגדיר את הנוירונים ברשת העצבית. התוצאה היא מודל למידה עמוקה, שלאחר האימון הוא מעבד נתונים חדשים. מודלים של למידה עמוקה מקבלים מידע ממספר מקורות נתונים ומנתחים את הנתונים האלה בזמן אמת, ללא צורך בהתערבות אנושית. בלמידה עמוקה, יחידות עיבוד גרפיקה (GPUs) ממוטבות עבור מודלים של אימון מכיוון שהן יכולות לעבד מספר חישובים בו-זמנית.
למידה עמוקה היא מה שמניע הרבה טכנולוגיות בינה מלאכותית (AI) שיכולות לשפר את האוטומציה והמשימות האנליטיות. רוב האנשים נתקלים בלמידה עמוקה מדי יום כאשר הם גולשים באינטרנט או משתמשים בטלפונים הניידים שלהם. בין אינספור יישומים אחרים, למידה עמוקה משמשת ליצירת כיתובים עבור סרטוני YouTube, מבצעת זיהוי דיבור בטלפונים וברמקולים חכמים, מספקת זיהוי פנים לתצלומים ומאפשרת מכוניות אוטונומיות. וכפי מדעני נתונים וחוקרים מתמודדים עם פרויקטים מורכבים יותר ויותר של למידה עמוקה - תוך מינוף מסגרות למידה עמוקה - סוג זה של בינה מלאכותית יהפוך רק לחלק גדול יותר מחיי היומיום שלנו.
במילים פשוטות, למידה עמוקה היא שם לרשתות עצביות עם שכבות רבות.
כדי לפרש נתונים תצפיתיים, כגון תמונות או שמע, רשתות עצביות מעבירות נתונים דרך שכבות מקושרות של צמתים. כשמידע עובר בשכבה, כל צומת בשכבה מבצע פעולות פשוטות על הנתונים ומעביר את התוצאות בצמתים אחרים באופן בררני. כל אחת מהשכבות הבאות מתמקדת בתכונה ברמה גבוהה יותר מהתכונה הקודמת, עד שהרשת יוצרת את הפלט.
ב- בין שכבת הקלט לשכבת הפלט יש שכבות מוסתרות. זה המקום שבו ההבחנה מגיעה בין רשתות עצביות ולמידה עמוקה: רשת עצבית בסיסית יכולה לכלול שכבה אחת או שתיים מוסתרות, ואילו רשת למידה עמוקה עשויה לכלול עשרות - או אפילו מאות - של שכבות. הגדלת מספר השכבות והצמתים השונים עשויה להגביר את הדיוק של הרשת. עם זאת, שכבות נוספות יכולות גם להיות מודעות לכך שמודל ידרוש יותר פרמטרים ומשאבי חישוב.
למידה עמוקה מסווגת מידע באמצעות שכבות של רשתות עצביות, שיש להן סל נתוני קלט שמקבלים נתונים גולמיים. לדוגמה, אם רשת עצבית מאומנת בתמונות של ציפורים, ניתן להשתמש בה לזיהוי תמונות של ציפורים. שכבות נוספות מאפשרות תוצאות מדויקות יותר, כגון הבחנה בין עורב לעורב לעומת הבחנה בין עורב לעוף. לרשתות עצביות עמוקות, שעומדות מאחורי אלגוריתמים של למידה עמוקה, יש מספר שכבות נסתרות בין צומתי הקלט והפלט - מה שאומר שהן מסוגלות לבצע סיווגי נתונים מורכבים יותר. אלגוריתם למידה עמוקה חייב להיות מאומן עם קבוצות גדולות של נתונים, וככל שהוא מקבל יותר נתונים, כך הוא יהיה מדויק יותר; יהיה צורך להאכיל אותו אלפי תמונות של ציפורים לפני שהוא יוכל לסווג במדויק תמונות חדשות של ציפורים.
כשמדובר ברשתות עצביות, אימון מודל הלמידה העמוקה הוא אינטנסיבי מאוד. זאת כאשר הרשת העצבית מטמיעה קלטים, המעובדים בשכבות מוסתרות באמצעות משקלים (פרמטרים המייצגים את חוזק החיבור בין ערכי הקלט) המותאמים במהלך האימון, והמודל מפרסם תחזית. המשקלים מותאמים על בסיס נתוני הקלט של האימון כדי לבצע תחזיות טובות יותר. מודלים של למידה עמוקה מבזבזים זמן רב באימון כמויות גדולות של נתונים, וזו הסיבה שמחשוב בעל ביצועים גבוהים כל כך חשוב.
המעבדים הגרפיים מותאמים לחישובי נתונים ומתוכננים לביצועים מהירים של חישובי מטריצה בקנה מידה גדול. מופעי GPU מתאימים ביותר לביצוע מקבילי עבור למידת מכונה בקנה מידה גדול (ML) ובעיות למידה עמוקה. כתוצאה מכך, יישומי למידת מכונה שמבצעים מספר גבוה של חישובים על כמויות גדולות של נתונים מובנים או לא מובנים - כגון תמונה, טקסט ווידאו - נהנים מביצועים טובים.
אחד היתרונות העיקריים של למידה עמוקה הוא שהרשתות העצביות שלה משמשות לחשיפת תובנות נסתרות וקשרים מנתונים שלא היו גלויים בעבר. עם מודלים חזקים יותר של למידת מכונה שיכולים לנתח נתונים גדולים ומורכבים, חברות יכולות לשפר את זיהוי ההונאות, ניהול שרשרת האספקה ואבטחת הסייבר על ידי מינוף הדברים הבאים:
ניתוח נתונים לא מובנים: אלגוריתמים של למידה עמוקה יכולים להכשיר כדי להסתכל על נתוני טקסט על-ידי ניתוח פוסטים, חדשות וסקרים של מדיה חברתית כדי לספק תובנות עסקיות ולקוחות חשובות.
תיוג נתונים: למידה עמוקה דורשת נתונים מתויגים לאימון. לאחר אימון, הוא יכול לתייג נתונים חדשים ולזהות סוגים שונים של נתונים בכוחות עצמו.
הנדסת תכונות: אלגוריתם למידה עמוקה יכול לחסוך זמן מכיוון שהוא אינו דורש מבני אדם לחלץ תכונות באופן ידני מנתונים גולמיים.
יעילות: כאשר אלגוריתם למידה עמוקה מאומן כראוי, הוא יכול לבצע אלפי משימות שוב ושוב, מהר יותר מבני אדם.
הדרכה: לרשתות העצביות המשמשות בלמידה עמוקה יש את היכולת להחיל על סוגי נתונים ויישומים רבים ושונים. בנוסף, מודל למידה עמוקה יכול להסתגל על ידי אימון מחדש שלו עם נתונים חדשים.
בינה מלאכותית, למידת מכונה ולמידה עמוקה קשורים כולם, אבל יש להם מאפיינים ייחודיים:
בינה מלאכותית (AI): בינה מלאכותית מאפשרת למחשבים, מכונות או רובוטים לחקות את היכולות של אדם, כגון קבלת החלטות, זיהוי אובייקטים, פתרון בעיות והבנה של שפה.
למידת מכונה (ML): למידת מכונה היא תת-קבוצה של בינה מלאכותית המתמקדת בבניית יישומים שיכולים ללמוד מנתונים כדי לשפר את הדיוק שלהם לאורך זמן, ללא התערבות אנושית. ניתן לאמן אלגוריתמים של למידת מכונה כדי למצוא דפוסים לקבלת החלטות ותחזיות טובות יותר, אך בדרך כלל זה דורש התערבות אנושית.
למידה עמוקה: למידה עמוקה היא תת-קבוצה של למידת מכונה המאפשרת למחשבים לפתור בעיות מורכבות יותר. מודלים של למידה עמוקה יכולים גם ליצור מאפיינים חדשים משלהם.
למידה עמוקה יכולה לשמש לניתוח מספר רב של תמונות, אשר יכול לעזור לרשתות חברתיות לגלות יותר על המשתמשים שלהם. הדבר משפר פרסומות ממוקדות ועוקב אחר הצעות.
כספים: רשתות עצביות בלמידה עמוקה יכולות לשמש כדי לחזות ערכי מניות ולפתח אסטרטגיות מסחר, והן יכולות גם לזהות איומי אבטחה ולהגן מפני הונאה.
בריאות: למידה עמוקה יכולה למלא תפקיד מרכזי בתחום הבריאות על ידי ניתוח מגמות והתנהגויות לחיזוי מחלות בחולים. עובדי בריאות יכולים גם להשתמש באלגוריתמים של למידה עמוקה כדי להחליט על הבדיקות והטיפולים האופטימליים עבור המטופלים שלהם.
אבטחת סייבר: למידה עמוקה יכולה לזהות איומים מתקדמים טוב יותר מפתרונות נוזקה מסורתיים על ידי זיהוי פעילויות חדשות וחשודות במקום תגובה למסד נתונים של איומים ידועים.
עוזרים דיגיטליים: עוזרים דיגיטליים מייצגים כמה מהדוגמאות הנפוצות ביותר ללמידה עמוקה. בעזרת עיבוד שפה טבעית (NLP), Siri, Cortana, Google ו-Alexa יכולים להגיב לשאלות ולהתאים את עצמם להרגלי המשתמש.
בעוד שמתגלים שימושים חדשים ללמידה עמוקה, עדיין מדובר בתחום מתפתח עם מגבלות מסוימות:
כמויות גדולות של נתונים: כדי להשיג תשובות מופשטות ותובנות יותר, למידה עמוקה דורשת כמות גדולה של נתונים לאימון. בדומה למוח האנושי, אלגוריתם למידה עמוקה זקוק לדוגמאות כדי שיוכל ללמוד מטעויות ולשפר את תוצאתו.
חוסר גמישות: מכונות עדיין לומדות בדרכים צרות מאוד, מה שיכול להוביל לטעויות. רשתות למידה עמוקה זקוקות לנתונים כדי לפתור בעיה ספציפית. אם תתבקש לבצע משימה מחוץ לטווח זה, סביר להניח שהיא תיכשל.
חוסר שקיפות: למרות שהוא עובר דרך מיליוני נקודות נתונים כדי למצוא דפוסים, קשה להבין כיצד רשת עצבית מגיעה לפתרון שלה. חוסר שקיפות זה באופן שבו הם מעבדים נתונים מקשה על זיהוי הטיות לא רצויות והסברת תחזיות.
למרות המכשולים הללו, מדעני נתונים מתקרבים ומתקרבים לבניית מודלים מדויקים ביותר של למידה עמוקה שיכולים ללמוד ללא פיקוח - מה שיהפוך את הלמידה העמוקה למהירה יותר ופחות אינטנסיבית בעבודה.
עם פיצוץ הנתונים העסקיים, מדעני נתונים צריכים להיות מסוגלים לחקור ולבנות מודלים של למידה עמוקה במהירות ועם גמישות רבה יותר מאשר חומרת ה-IT המקומית המסורתית יכולה לספק.
Oracle Cloud Infrastructure (OCI) מציעה את מחשוב יחס המחיר-ביצועים הטוב ביותר עבור עומסי עבודה עתירי נתונים, אחסון מהיר בענן ורשת עם זמן השהיה קצר ותפוקה גבוהה עם RDMA של 100 ג'יגה-סיביות לשנייה. OCI מספק גם מופעי מחשוב GPU ללמידה עמוקה, תמונות קלות לפריסה והגמישות להפעלת תחנת עבודה של GPU אחת או אשכול של צורות GPU מרובות.
לבנייה, אימון ופריסה של מודלים של למידת מכונה על תשתית ענן בעלת ביצועים גבוהים, נסה את Oracle Cloud Infrastructure Data Science. מדעני נתונים יכולים לבנות ולאמן מודלים של למידה עמוקה בפחות זמן באמצעות GPUs של NVIDIA במפגשי מחברת. הם יכולים גם לבחור את כמות משאבי המחשוב והאחסון הדרושים להם כדי להתמודד עם פרויקטים בכל גודל מבלי לדאוג לגבי הקצאה או תחזוקה של תשתית. נוסף על כך, OCI Data Science מאיץ את בניית המודלים על ידי ייעול משימות מדע הנתונים, כגון גישה לנתונים, בחירת אלגוריתמים והסבר מודל.