יותר משלוש עשורים назад, רד האט ראתה את הפוטנציאל של פיתוח ורישיונות קוד פתוח כדי ליצור תוכנות טובות יותר ולטפח חדשנות בטכנולוגיית המידע. שלושים מיליון שורות קוד אחרי, לינוקס לא רק שהתפתח עד שנעשה התוכנה הקוד הפתוח המצליחה ביותר, כמו כן היא שומרת על המיקום הזה עד היום. המחויבות לעקרונות הקוד הפתוח נמשכת, לא רק במודל העסקי התאגידי, כמו כן זה חלק מתרבות העבודה. בהערכת החברה, המושגים הללו יש להם את אותו השפעה על אינטליגנציה מלאכותית (IA) אם נעשים בדרך הנכונה, אבל עולם הטכנולוגיה מחולק לגבי מה תהיה ה"דרך הנכונה"
הבינה המלאכותית, במיוחד המודלים הגדולים של שפה (LLMs) מאחורי ה-AI הגנרטיבי (gen AI), לא ניתן לראות זאת באותה צורה כמו תוכנית פתוחה. בניגוד לתוכנה, מודלי ה-AI consistem principalmente em modelos de parâmetros numéricos que determinam como um modelo processa inputs, כמו גם החיבור שעושה בין מספר נקודות נתונים. פרמטרים של מודלים מאומנים הם תוצאה של תהליך ארוך הכולל כמויות עצומות של נתוני אימון המוכנים בקפידה, מעורבים ומעובדים
אם כי פרמטרי המודל אינם תוכנה, בכמה היבטים יש להם תפקיד דומה לקוד. קל לעשות את ההשוואה שהנתונים הם הקוד-מקור של המודל, אתם הייתם מאוד קרובים אליו. לא קוד פתוח, הקוד המקורי מוגדר בדרך כלל כ"צורת העדפה" לביצוע שינויים בתוכנה. הנתונים של האימון לבד לא מתאימים לפונקציה הזו, בהתחשב בכך שהגודל שלו שונה ותהליך ההכשרה המוקדמת המורכב שלו שמוביל לקשר רופף ועקיף שיש לכל פריט מהנתונים ששימשו בהכשרה עם הפרמטרים המוכנים והתנהגות המודל הנובעת מכך
רוב השיפורים והשדרוגים במודלים של בינה מלאכותית שמתרחשים עכשיו בקהילה אינם כוללים גישה או מניפולציה של הנתונים המקוריים של האימון. במקום זאת, הם תוצאה של שינויים בפרמטרי המודל או בתהליך או כוונון שיכולים לשמש גם כדי להתאים את הביצועים של המודל. החירות לבצע את השיפורים הללו במודל דורשת שהפרמטרים יושקו עם כל ההרשאות שהמשתמשים מקבלים תחת רישיונות קוד פתוח
חזון רד האט עבור בינה מלאכותית קוד פתוח
רד האט מאמינה שהבסיס של בינה מלאכותית קוד פתוח נמצא בפרמטרי מודל מורשים בקוד פתוח משולבים עם רכיבי תוכנה בקוד פתוח. זהו נקודת התחלה של בינה מלאכותית בקוד פתוח, אבל לא היעד האחרון של הפילוסופיה. רד האט מעודדת את קהילת הקוד הפתוח, רשויות רגולטוריות והתעשייה ממשיכות לשאוף להשגת שקיפות רבה יותר והתאמה עם עקרונות הפיתוח בקוד פתוח בעת אימון והתאמת מודלים של בינה מלאכותית
זו התמונה של רד האט כחברה, מה כולל מערכת אקולוגית של תוכנה קוד פתוח, אפשר לעסוק בצורה מעשית עם בינה מלאכותית קוד פתוח. זו לא ניסיון להגדרה פורמלית, כיצד מה ליוזמת קוד פתוח(OSI) מפתחת עם שלההגדרת בינה מלאכותית בקוד פתוח(OSAID). זהו נקודת המבט של התאגיד שעושה את ה-AI בקוד פתוח בר ביצוע ונגיש לקבוצת הקהילות הגדולה ביותר, ארגונים וספקים
נקודת מבט זו מיושמת בפועל באמצעות עבודה עם קהילות קוד פתוח, בולט על ידי הפרויקטאינסטרקטלאב, מנוהל על ידי רד האט ומאמצים עם IBM Researchבמשפחת גרניט של מודלים בקוד פתוח עם רישוי. ה-InstructLab מפחית באופן משמעותי את המחסומים כך שאנשים שאינם מדעני נתונים יוכלו לתרום למודלים של בינה מלאכותית. עם InstructLab, מומחים בתחום מכל הסקטורים יכולים להוסיף את כישוריהם וידע שלהם, גם לשימוש פנימי וגם כדי לעזור למודל קוד פתוח של בינה מלאכותית משותף ונגיש באופן רחב לקהילות עליונות
משפחת דגמי גרניט 3.0 עוסקת במגוון רחב של מקרים של שימוש בבינה מלאכותית, מיצירת קוד ועד עיבוד שפה טבעית כדי לחלץתובנותמסטים גדולים של נתונים, הכל תחת רישיון קוד פתוח מתירני. אנחנו עזרנו ל-IBM Research להביא את משפחת המודלים Granite לעולם הקוד הפתוח וממשיכים לתמוך במשפחת המודלים, גם מנקודת מבט של קוד פתוח וגם כחלק מההצעה שלנו Red Hat AI
ההד שלההודעות האחרונות של DeepSeekהראה כיצד החדשנות בקוד פתוח יכולה להשפיע על הבינה המלאכותית, גם ברמת המודל וגם מעבר לכך. ברור שיש חששות לגבי הגישה של הפלטפורמה הסינית, בעיקרון, רישיון המודל לא מסביר איך הוא יוצר, מה שמחזק את הצורך בשקיפות. עם זאת, ההפרעה המוזכרת מחזקת את החזון של רד האט לגבי העתיד של הבינה המלאכותית: עתיד פתוח, ממוקד במודלים קטנים יותר, מְיֻעָדִים וּפְתוּחִים, שיכולים להיות מותאמים למקרי שימוש של נתונים עסקיים ספציפיים בכל מקום בענן ההיברידי.
הרחבת מודלים של בינה מלאכותית מעבר לקוד פתוח
העבודה של רד האט בתחום ה-AI בקוד פתוח הולכת הרבה מעבר ל-InstructLab ולמשפחת המודלים גרניט, נכנס עד לכלים ולפלטפורמות הנדרשות כדי באמת לצרוך ולהשתמש ב-AI בצורה פרודוקטיבית. החברה הפכה מאוד פעילה בקידום פרויקטים וקהילות טכנולוגיה, כמו למשל (אבל לא רק):
● רמהלמה, פרויקט קוד פתוח שמטרתו להקל על ניהול והנגשה מקומית של מודלים של בינה מלאכותית
● טרסטיAI, ערכת כלים קוד פתוח לבניית זרימות עבודה של בינה מלאכותית אחראיות יותר
● קלימטיק, פרויקט שממוקד בעזרה להפוך את הבינה המלאכותית ליותר ברת קיימא בכל הנוגע לצריכת אנרגיה
● מעבדת בינה מלאכותית פודמן, ערכת כלים למפתחים הממוקדת בהקלת הניסוי עם LLMs קוד פתוח
ההודעה עדכניתעל נוירל מג'יק מרחיבה את התפיסה הארגונית לגבי בינה מלאכותית, מאפשר לארגונים ליישר מודלים של בינה מלאכותית קטנים ומאופיינים, כולל מערכות קוד פתוח עם רישיונות, עם הנתונים שלך, איפה שהם חיים בענן היברידי. ארגוני ה-IT יכולים, אז, להשתמש בשרת אינפרנציהvLLMכדי להניע את ההחלטות ואת הייצור של המודלים הללו, עוזר לבנות ערמת בינה מלאכותית מבוססת על טכנולוגיות שקופות עם תמיכה
למוסד, הבינה המלאכותית הקוד הפתוח חיה ונושמת בענן ההיברידי. הענן ההיברידי מספק את הגמישות הנדרשת לבחירת הסביבה הטובה ביותר עבור כל עומס עבודה של בינה מלאכותית, מייעלים את הביצועים, עלות, סולם ודרישות אבטחה. הפלטפורמות, המטרות והארגון של רד האט תומכים במאמצים אלה, ביחד עם שותפים מהתחום, לקוחות והקהילה של קוד פתוח, כשהקוד הפתוח בבינה מלאכותית מונע
יש פוטנציאל עצום להרחיב את שיתוף הפעולה הפתוח בתחום הבינה המלאכותית. רד האט רואה עתיד שכולל עבודה שקופה במודלים, כמו האימון שלו. יהיה בשבוע הבא או בחודש הבא (או אפילו לפני, בהתחשב במהירות ההתפתחות של הבינה המלאכותית, החברה והקהילה פתוחות, כמו כולו, ימשיכו לתמוך ולאמץ את המאמצים לדמוקרטיזציה ולפתיחת עולם ה-AI