המכון לחדשנות טכנולוגית מכריז על השקת NOOR, מודל עיבוד השפה הטבעית בערבית הגדול בעולם

דרוג:

 

המכון לחדשנות טכנולוגית מכריז על השקת NOOR, מודל עיבוד השפה הטבעית בערבית הגדול בעולם

*המודל הוא החזק ביותר בשפה הערבית עד כה עם 10 מיליארד משתנים

*כולל יישומים בתחומים כמו תקצור אוטומטי, צ'אטבוטים, שיווק מותאם אישית

 

 

אבו דאבי, איחוד האמירויות, 11 באפריל 2022, (BUSINESS WIRE):

 

המכון לחדשנות טכנולוגית - Technology Innovation Institute (TII), מרכז מחקר עולמי ועמוד תווך בתחום המחקר היישומי של מועצת המחקר הטכנולוגי המתקדם של אבו דאבי (ATRC), הודיע ​​היום על השקת NOOR, מודל עיבוד השפה הטבעית (NLP) בערבית הגדול בעולם עד כה.

 

צוות החוקרים המתקדם ומומחי הבינה המלאכותית (AI) של TII איחד כוחות עם LightOn, חברת טכנולוגיה המשחררת לשימוש בינת מכונות בקנה מידה גדול במיוחד לעסקים, כדי לשנות את מודל עיבוד השפה הטבעית הערבי. למודל NOOR יש את היכולת לבצע משימות מעבר לתחום השפה - ומציע נתונים באיכות גבוהה מקצה לקצה, כולל סריקה, סינון ואצירה בקנה מידה גדול. המודל מאפשר הכשרה והגשה מבוזרת בקנה מידה גדול במיוחד - כדי לספק יישומים המציעים התמחות לטובת להסקת מסקנות ומודלים יעילים.

ד"ר ריי או. ג'ונסון, מנכ"ל, TII ו-ASPIRE, אמר: "עם הפיתוח הזה, אנו נמצאים היטב על המסלול כדי לשפר את יכולות המחקר והאישורים שלנו, כמו גם להעלאת קרנה של אבו דאבי ואיחוד האמירויות כאקו סיסטם מחקרי רציני. צוותי המומחים שלנו הוכיחו שוב שאזור זה יכול להשיג תוצאות מחקר ופיתוח פורצות דרך כדי להשפיע על העולם".

ד"ר אבטסאם אלמאזרואי, מנהל, יחידת AI Cross-Center ב-TII, אמר: "מודלים גדולים של שפה כבשו בסערה את עולם עיבוד השפה הטבעית ואנו גאים להציג מודל חדשני זה עם 10 מיליארד משתנים - מודל NLP הערבי הגדול בעולם. מערך הנתונים הערבי הגדול והייחודי שנאסף כדי להכשיר את המודל הוא תוצאה של חודשים של עבודה קשה שכללה איסוף, גריטה וסינון של מקורות מגוונים. תודה מיוחדת לכל הצוות שעבד על הפרויקט הזה כדי להפוך את NOOR למודל החיפוש בערבית לאקדמאים ועסקים בכל מקום".

פרופ' מרוואן דבה, חוקר ראשי, מרכז המחקר למדע דיגיטלי ויחידת AI Cross-Center, TII, אמר לגבי ההשקה הקרובה: "עם NOOR, TII הרחיב את היקף המודל הסטנדרטי הערבי המודרני על ידי מינוף הידע בתחום מודלי השפה הגדולים לבניית מומחיות חוצת תחומים מתקדמת בדור החדש הזה של מחקר הבינה המלאכותית".

כדי לאצור את ערכות הנתונים הערביות הגדולות בעולם, ערכת הנתונים הייחודית של NOOR, המונה יותר מ-30 מיליארד מילים, משלבת נתוני אינטרנט עם ספרים, שירה, מאמרי חדשות ומידע טכני כדי להרחיב באופן משמעותי את תחולת המודל.

ד"ר אבטסאם אלמאזרואי אמר שמודל NOOR מבוסס על ארכיטקטורת שינוי או לימוד מכונה. מודל הפיענוח בלבד שלו דומה במבנהו ל-GPT-3 והוא מתוכנת להתמודד עם משימות יצירתיות עם ארכיטקטורה משודרגת כדי לשקף את ההתפתחויות האחרונות בעולם למידת המכונה, כולל שיפורים כגון הטמעות מיקום טובות יותר.  

 

 

כדי להבטיח איכות בקנה מידה גדול בערכת הנתונים של  ,NOORצוות TII תכנן צינור סינון אוטומטי המבוסס על טכניקות לימוד מכונה. כלים אלו מזהים מלל הרלוונטי להפניות איכותיות ומגנים על המודל מחשיפה לספאם.

 

NOOR עבר אימון באמצעות מחשוב בעל ביצועים גבוהים עם 128 מעבדים גרפיים מסוג A100, והוא ממנף גישת מקבילית תלת-ממדית מתקדמת כדי לאפשר הפצת חישובים תוך הבטחת שימוש יעיל במשאבי החומרה הזמינים.

 

מנהל היחידה לבינה מלאכותית הבין-מרכזית ציין כי זהו רק הצעד הראשון במאמצי היחידה לתרום לאסטרטגיה הרחבה יותר של איחוד האמירויות לבינה מלאכותית.

 

המודל נקרא על שם המילה הערבית "אור", כדי לבסס את המתאם של מודל השפה הערבית להארת המוח.

 

אודות Technology Innovation Institute (TII)

למידע נוסף, בקרו בכתובת www.tii.ae

*מקור: AETOSWire

תמונות / גלריית מולטימדיה זמינים: https://www.businesswire.com/news/home/52671760/en

 

*מקור: AETOSWire

 

קשרי מדיה

 

Technology Innovation Institute

Sneha Sivanand, [email protected]

 

 

כיתוב תמונה מצורפת: נור, מודל עיבוד השפה הטבעית (NLP) בערבית הגדול בעולם - צוות יחידת AI, המכון לחדשנות טכנולוגית (צילום: AETOSWire)

מקור: Technology Innovation Institute

תוכן הודעה זו בשפת המקור, מהווה את הגרסה הרשמית והמהימנה היחידה של מסמך זה. תרגומים מסופקים למטרות נוחות בלבד ויש להצליבם מול המסמך בשפת המקור, המהווה את הגרסה היחידה של טקסט זה שהינה בעלת תוקף משפטי.

 

*** הידיעה מופצת בעולם על ידי חברת התקשורת הבינלאומית BUSINESS WIRE

 

לפרטים נוספים: נוי תקשורת 03-6026026 זהר 052-2641769


כתבות נוספות בקטגוריה הייטק וטכנולוגיה

Advanced Communications and Electronic Systems (ACES) ו-Radisys חותמות על מזכר הבנות להאצת החדשנות והפיתוח של רשתות 5G אלחוטיות פתוחות (ORAN) Advanced Communications and Electronic Systems Com
Xsolla מרחיבה את מיצובה המוביל בתחום החידושים ופיתוחי המשחקים ב-APAC, באמצעות שותפות אסטרטגיות חדשות עם העיר בוסאן וחברת BDAN ‏Xsolla, חברה גלובלית למסחור של משחקי וידאו, מטרו
Recursion  ו- Exscientia, שתי מובילות בתחום גילוי התרופות בתחום הבינה המלאכותית, התאחדו באופן רשמי כדי לקדם את התיעוש של גילוי תרופות השילוב העסקי של שתי חברות גילוי ופיתוח תרופות מבוס
Microsoft Fabric ישנה את איכות הנתונים והשימושיות בכל רחבי הארגון Quantexa, ספקית מובילה בפתרונות מודיעין לקבלת החלט
Anaqua תירכש על ידי Nordic Capital, משקיעה פרטית מובילה בתחום הטכנולוגיה והתשלומים Anaqua, ספקית מובילה של פתרונות ושירותים טכנולוגיי
Tū Ātea ו-Mavenir משתפות פעולה כדי להיות לחלוצות בעתיד הרשתות המשתמשות בנכסי הספקטרום המאורי Mavenir, ספקית תשתיות הרשת בענן הבונה את עתיד הרשת
Cloudera תרכוש את הפלטפורמה של Octopai כדי לספק נתונים מהימנים לאורך כל אחוזת הנתונים בענן ההיברידי Cloudera, הפלטפורמה ההיברידית האמיתית היחידה עבור
Cloudera חושפת סייען בינה מלאכותית חדש שיעזור לשפר את היעילות עבור העוסקים בנתונים Cloudera, הפלטפורמה ההיברידית האמיתית היחידה עבור
Bitget Wallet השיקה תוכנית תמיכה למיני אפליקציות ב-Telegram בהיקף של 20 מיליון דולר בשיתוף עם Foresight Ventures Bitget Wallet, אפליקציית ארנק ה-Web3 ללא משמורת המ
חברת F5 ממנפת את NVIDIA BlueField-3 DPUs כדי להאיץ את אספקת יישומי AI עבור ספקי שירותים וארגונים גדולים חברת F5 ממנפת את NVIDIA BlueField-3 DPUs כדי להאיץ
Xsolla השיקה את הדו"ח לסתיו 2024 על עתיד הגיימינג במכשירים ניידים ופיתוח משחקים: ניתוח נתונים אחרון ומגמות מתפתחות Xsolla, חברה עולמית למסחר במשחקי וידאו, גאה להכריז
דאק קריק מקימה מרכז מצוינות בפולין כדי לשפר את התמיכה הגלובלית בלקוחות Duck Creek Technologies (דאק קריק טכנולוגיות), ספק
11x גייסה 50 מיליון דולר עם סדרה B בהובלת Andreessen Horowitz כדי להאיץ את עידן העובדים הדיגיטליים 11x, המובילה בתחום העובדים הדיגיטליים מונעי הבינה
Synchronoss מחדשת את השותפות עם מפעילה צרפתית מובילה Synchronoss Technologies, Inc. ("Synchronoss" או
Hakeem של Walee Financial Services זכה בפרס המצוינות של פסטיבל הפינטק בסינגפור עבור מוצרי פינטק פורצי דרך Walee Financial Services מכריזה בגאווה כי מוצר הפי
Lantronix מאיצה את מובילות ה-IoT שלה עם רכישה אסטרטגית של פורטפוליו ה-IoT של NetComm Enterprise מבית DZS Lantronix Inc. לנטרוניקס (נאסד"ק: LTRX), ספקית גלו
שימוש ב-Milbros UV Graphs משפר את הבטיחות וההחזרה בניקוי מכלים כימיים Milbros, פתרון של Veson Nautical ומסד הנתונים האמי
Bitget רושמת את Swell (SWELL) ב-Launchpool, Poolx ו-Spot עם 23,440,000 אסימונים כפרסים Bitget, בורסת המטבעות הקריפטוגרפים וחברת ה-Web3 המ
MLL Legal בוחרת בפלטפורמת משרדי עורכי הדין AQX של Anaqua כדי לשפר את ניהול הקניין הרוחני ולהניע יעילות תפעולית Anaqua, הספקית המובילה של טכנולוגיית ניהול חדשנות
Vasion מסירה את הלוט מעל אוטומציית הפלט: מחוללת מהפכה בניהול פלט ואוטומציה של זרימת עבודה באמצעות פתרון מקורי בענן ®Vasion, חלוצה בהדפסה ללא שרת ובאוטומציה מתוזמרת,
הוסף תגובה 
תגובות  ( תגובות)