לפני יותר משלושה עשורים, רד האט ראתה את הפוטנציאל של פיתוח ורישוי בקוד פתוח ליצירת תוכנה טובה יותר ולטפח חדשנות בתחום ה-IT. שלושים מיליון שורות קוד מאוחר יותר, לינוקס לא רק התפתחה והפכה לתוכנת הקוד הפתוח המצליחה ביותר, אלא גם שומרת על מעמד זה עד היום. המחויבות לעקרונות הקוד הפתוח נמשכת, לא רק במודל העסקי הארגוני, אלא גם כחלק מתרבות העבודה. להערכת החברה, למושגים אלו יש את אותה השפעה על בינה מלאכותית (AI) אם הן מבוצעות נכון, אך עולם הטכנולוגיה חלוק בדעתו מהי "הדרך הנכונה".
בינה מלאכותית, ובמיוחד מודלי השפה הגדולים (LLMs) העומדים מאחורי בינה מלאכותית גנרטיבית (gen AI), לא ניתנת להתייחסות באותו אופן כמו לתוכנית קוד פתוח. שלא כמו תוכנה, מודלים של בינה מלאכותית מורכבים בעיקר ממודלים של פרמטרים מספריים הקובעים כיצד מודל מעבד קלטים, כמו גם את הקשר שהוא יוצר בין נקודות נתונים שונות. פרמטרים של מודלים מאומנים הם תוצאה של תהליך ארוך הכולל כמויות עצומות של נתוני אימון המוכנים, מעורבבים ומעובדים בקפידה.
למרות שפרמטרי מודל אינם תוכנה, במובנים מסוימים יש להם פונקציה דומה לקוד. קל להשוות את הנתונים לקוד המקור של המודל, או משהו קרוב מאוד אליו. בקוד פתוח, קוד מקור מוגדר בדרך כלל כ"דרך המועדפת" לבצע שינויים בתוכנה. נתוני אימון לבדם אינם מתאימים לפונקציה זו, בהתחשב בגודלם המשתנה ובתהליך טרום-האימון המורכב שמביא לקשר רופף ועקיף שיש לכל פריט נתונים המשמש באימון עם הפרמטרים המאומנים והתנהגות המודל הנובעת מכך.
רוב השיפורים והשיפורים במודלים של בינה מלאכותית המתרחשים כיום בקהילה אינם כרוכים בגישה או מניפולציה של נתוני האימון המקוריים. במקום זאת, הם נובעים משינויים בפרמטרי המודל או מתהליך או התאמה שעשויים לשמש גם לכוונון עדין של ביצועי המודל. החופש לבצע שיפורים אלה במודל מחייב שחרור פרמטרים עם כל ההרשאות שמשתמשים מקבלים במסגרת רישיונות קוד פתוח.
החזון של רד האט לבינה מלאכותית בקוד פתוח.
רד האט מאמינה כי הבסיס של בינה מלאכותית בקוד פתוח טמון בפרמטרים של מודלים ברישיון בקוד פתוח בשילוב עם רכיבי תוכנה בקוד פתוח . זוהי נקודת התחלה עבור בינה מלאכותית בקוד פתוח, אך לא היעד הסופי של הפילוסופיה. רד האט מעודדת את קהילת הקוד הפתוח, רשויות רגולטוריות והתעשייה להמשיך ולשאוף לשקיפות רבה יותר וליישור עם עקרונות פיתוח קוד פתוח בעת אימון וכוונון מודלים של בינה מלאכותית.
זהו החזון של רד האט כחברה המקיפה מערכת אקולוגית של תוכנה בקוד פתוח ויכולה לעסוק באופן מעשי בבינה מלאכותית בקוד פתוח. זה לא ניסיון להגדרה פורמלית, כמו זו שמפתחת יוזמת הקוד הפתוח הגדרת הבינה המלאכותית בקוד פתוח (OSAID). זוהי נקודת המבט של התאגיד כיצד להפוך את הבינה המלאכותית בקוד פתוח לאפשרית ונגישה למגוון הרחב ביותר האפשרי של קהילות, ארגונים וספקים.
נקודת מבט זו מיושמת הלכה למעשה באמצעות עבודה עם קהילות קוד פתוח, כפי שמודגש על ידי InstructLab , בהובלת Red Hat, והמאמץ עם IBM Research על משפחת Granite של מודלים בקוד פתוח מורשים . InstructLab מפחית משמעותית את המחסומים בפני אנשים שאינם מדעני נתונים לתרום מודלים של בינה מלאכותית. בעזרת InstructLab, מומחי תחום מכל המגזרים יכולים להוסיף את כישוריהם וידעיהם, הן לשימוש פנימי והן כדי לסייע ביצירת מודל בינה מלאכותית בקוד פתוח משותף ונגיש לציבור עבור קהילות במעלה הזרם.
משפחת המודלים של Granite 3.0 מטפלת במגוון רחב של מקרי שימוש בבינה מלאכותית, החל מיצירת קוד ועד עיבוד שפה טבעית ועד לחילוץ תובנות ממערכי נתונים גדולים, והכל תחת רישיון קוד פתוח מתיר. עזרנו ל-IBM Research להביא את משפחת מודלי הקוד של Granite לעולם הקוד הפתוח וממשיכים לתמוך במשפחת המודלים, הן מנקודת מבט של קוד פתוח והן כחלק מהיצע הבינה המלאכותית של Red Hat.
ההשלכות של ההכרזות האחרונות של DeepSeek מראות כיצד חדשנות בקוד פתוח יכולה להשפיע על בינה מלאכותית, הן ברמת המודל והן מעבר לה. ברור שישנן חששות לגבי הגישה של הפלטפורמה הסינית, במיוחד משום שרישיון המודל אינו מסביר כיצד הוא נוצר, מה שמחזק את הצורך בשקיפות. עם זאת, השיבוש הנ"ל מחזק את חזונה של רד האט לעתיד הבינה המלאכותית: עתיד פתוח המתמקד במודלים קטנים יותר, אופטימליים ופתוחים שניתן להתאים אישית למקרי שימוש ספציפיים בנתונים ארגוניים בכל מיקום בענן ההיברידי.
הרחבת מודלים של בינה מלאכותית מעבר לקוד פתוח.
עבודתה של רד האט בתחום הבינה המלאכותית בקוד פתוח חורגת הרבה מעבר ל-InstructLab ולמשפחת המודלים של Granite, וכוללת גם את הכלים והפלטפורמות הדרושים לצריכה ושימוש יעיל בפועל בבינה מלאכותית. החברה הפכה לפעילה מאוד בטיפוח פרויקטים וקהילות טכנולוגיות, כגון (אך לא רק):
● RamaLama , פרויקט קוד פתוח שמטרתו להקל על הניהול והפריסה המקומיים של מודלים של בינה מלאכותית;
● TrustyAI , ערכת כלים בקוד פתוח לבניית זרימות עבודה אחראיות יותר של בינה מלאכותית;
● Climatik , פרויקט המתמקד בסיוע בהפיכת הבינה המלאכותית לקיימת יותר בכל הנוגע לצריכת אנרגיה;
● מעבדת פודמן לבינה מלאכותית , ערכת כלים למפתחים המתמקדת בהקלת ניסויים עם תוכניות לימודים לתואר ראשון בקוד פתוח;
ההכרזה האחרונה על Neural Magic מרחיבה את החזון התאגידי לבינה מלאכותית, ומאפשרת לארגונים ליישר קו בין מודלים קטנים ומותאמים אישית של בינה מלאכותית, כולל מערכות קוד פתוח מורשות, לנתונים שלהם, בכל מקום בו הם נמצאים בענן ההיברידי. לאחר מכן, ארגוני IT יכולים להשתמש vLLM כדי להניע החלטות וייצור ממודלים אלה, ובכך לסייע בבניית מחסנית בינה מלאכותית המבוססת על טכנולוגיות שקופות ונתמכות.
עבור התאגיד, בינה מלאכותית בקוד פתוח חיה ונושם בענן ההיברידי. הענן ההיברידי מספק את הגמישות הדרושה לבחירת הסביבה הטובה ביותר עבור כל עומס עבודה של בינה מלאכותית, תוך אופטימיזציה של ביצועים, עלות, קנה מידה ודרישות אבטחה. הפלטפורמות, המטרות והארגון של רד האט תומכים במאמצים אלה, יחד עם שותפים בתעשייה, לקוחות וקהילת הקוד הפתוח, ככל שקוד פתוח בבינה מלאכותית מתקדם קדימה.
יש פוטנציאל עצום להרחבת שיתוף הפעולה הפתוח הזה בתחום הבינה המלאכותית. רד האט צופה עתיד הכולל עבודה שקופה על מודלים, כמו גם הכשרתם. בין אם בשבוע הבא או בחודש הבא (או אפילו מוקדם יותר, בהתחשב בהתפתחות המהירה של הבינה המלאכותית), החברה והקהילה הפתוחה כולה ימשיכו לתמוך ולאמץ מאמצים לדמוקרטיזציה ולפתיחה של עולם הבינה המלאכותית.

