ഹോം വാർത്താക്കുറിപ്പുകൾ സമാരംഭിക്കുന്നു , ജനറൽ... ഡിസ്ട്രിബ്യൂട്ടഡ് അനുമാനത്തിന് ശക്തി പകരുന്നു.

റെഡ് ഹാറ്റ് എൽഎൽഎം-ഡി കമ്മ്യൂണിറ്റി സമാരംഭിച്ചു, ജനറേഷൻ എഐ ഡിസ്ട്രിബ്യൂട്ടഡ് ഇൻഫറൻസിനെ സ്കെയിലിൽ പവർ ചെയ്യുന്നു.

 കോർ‌വീവ്, ഗൂഗിൾ ക്ലൗഡ്, ഐ‌ബി‌എം റിസർച്ച്, എൻ‌വിഡിയ തുടങ്ങിയ കമ്പനികളുടെ പിന്തുണയോടെ, ഒരു പുതിയ ഓപ്പൺ സോഴ്‌സ് പ്രോജക്റ്റ് llm-d ആരംഭിച്ചു. ജനറേറ്റീവ് AI (ജെൻ AI) യുടെ ഭാവിയിലെ ഏറ്റവും നിർണായകമായ ആവശ്യം ത്വരിതപ്പെടുത്തുന്നതിൽ ഈ സംരംഭം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു: സ്കെയിലിൽ അനുമാനം. കുബേർനെറ്റ്സ്-നേറ്റീവ് ആർക്കിടെക്ചറിനെ അടിസ്ഥാനമാക്കി, പ്രോഗ്രാം vLLM-ഉം ഇന്റലിജന്റ്, AI-അവബോധമുള്ള നെറ്റ്‌വർക്ക് റൂട്ടിംഗും ഉപയോഗിച്ച് വിതരണം ചെയ്ത അനുമാനം ഉപയോഗിക്കുന്നു, ഇത് ഉൽ‌പാദനത്തിൽ ഏറ്റവും ആവശ്യപ്പെടുന്ന സേവന-തല ലക്ഷ്യങ്ങൾ (SLO-കൾ) നിറവേറ്റുന്ന വലിയ തോതിലുള്ള ഭാഷാ മോഡലുകൾ (LLM) നായി ശക്തമായ അനുമാന മേഘങ്ങൾ സൃഷ്ടിക്കാൻ പ്രാപ്തമാക്കുന്നു.

പരിശീലനം ഇപ്പോഴും നിർണായകമാണെങ്കിലും, Gen AI യുടെ യഥാർത്ഥ സ്വാധീനം കൂടുതൽ കാര്യക്ഷമവും അളക്കാവുന്നതുമായ അനുമാനത്തെ ആശ്രയിച്ചിരിക്കുന്നു - AI മോഡലുകളെ പ്രവർത്തനക്ഷമമായ ഉൾക്കാഴ്ചകളിലേക്കും ഉപയോക്തൃ അനുഭവങ്ങളിലേക്കും പരിവർത്തനം ചെയ്യുന്ന എഞ്ചിൻ. ഗാർട്ട്നറുടെ അഭിപ്രായത്തിൽ, 2028 ആകുമ്പോഴേക്കും, വിപണി പക്വത പ്രാപിക്കുമ്പോൾ, ഡാറ്റാ സെന്ററുകളിലെ 80%-ത്തിലധികം വർക്ക്‌ലോഡ് ആക്സിലറേറ്ററുകളും പരിശീലനത്തിന് പകരം പ്രത്യേകമായി അനുമാനത്തിനായി വിന്യസിക്കപ്പെടും. ഇതിനർത്ഥം Gen AI യുടെ ഭാവി നിർവ്വഹണ ശേഷിയിലാണ് എന്നാണ്. വർദ്ധിച്ചുവരുന്ന സങ്കീർണ്ണവും സങ്കീർണ്ണവുമായ ന്യായവാദ മോഡലുകളുടെ വർദ്ധിച്ചുവരുന്ന വിഭവ ആവശ്യങ്ങൾ കേന്ദ്രീകൃത അനുമാനത്തിന്റെ പ്രവർത്തനക്ഷമതയെ പരിമിതപ്പെടുത്തുകയും വിലക്കപ്പെട്ട ചെലവുകളും തടസ്സപ്പെടുത്തുന്ന കാലതാമസവും കാരണം AI നവീകരണത്തിൽ തടസ്സങ്ങൾ സൃഷ്ടിക്കുമെന്ന് ഭീഷണിപ്പെടുത്തുകയും ചെയ്യുന്നു.

അളക്കാവുന്ന അനുമാനത്തിന്റെ ആവശ്യകതയോട് പ്രതികരിക്കുന്നു 

ഒരൊറ്റ സെർവറിന്റെ പരിമിതികളെ മറികടക്കുന്നതിനും പ്രൊഡക്ഷൻ-സ്കെയിൽ AI അനുമാനം അൺലോക്ക് ചെയ്യുന്നതിനും vLLM-ന്റെ ശക്തി വിപുലീകരിക്കുന്ന ഒരു ദീർഘവീക്ഷണ പദ്ധതിയായ llm-d-യുമായി Red Hat-ഉം അതിന്റെ വ്യവസായ പങ്കാളികളും നേരിട്ട് ഈ വെല്ലുവിളിയെ അഭിസംബോധന ചെയ്യുന്നു. Kubernetes-ന്റെ തെളിയിക്കപ്പെട്ട ഓർക്കസ്ട്രേഷൻ പവർ ഉപയോഗിച്ച്, നിലവിലുള്ള എന്റർപ്രൈസ് ഐടി ഇൻഫ്രാസ്ട്രക്ചറുകളിലേക്ക് വിപുലമായ അനുമാന ശേഷികളെ llm-d സംയോജിപ്പിക്കുന്നു. കാര്യക്ഷമത വർദ്ധിപ്പിക്കുന്നതിനും ഉയർന്ന പ്രകടനമുള്ള AI ആക്സിലറേറ്ററുകളുമായി ബന്ധപ്പെട്ട ഉടമസ്ഥാവകാശത്തിന്റെ മൊത്തം ചെലവ് (TCO) നാടകീയമായി കുറയ്ക്കുന്നതിനുമുള്ള നൂതന സാങ്കേതിക വിദ്യകൾ നടപ്പിലാക്കുന്നതിനൊപ്പം ബിസിനസ്സ്-നിർണ്ണായക വർക്ക്‌ലോഡുകളുടെ വൈവിധ്യമാർന്ന സേവന ആവശ്യങ്ങൾ നിറവേറ്റാൻ ഈ ഏകീകൃത പ്ലാറ്റ്‌ഫോം ഐടി ടീമുകളെ പ്രാപ്തരാക്കുന്നു.

എൽഎൽഎം-ഡി ശക്തമായ ഒരു കൂട്ടം നൂതനാശയങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു, അവയിൽ ചിലത് ഇവയാണ്:

  • ഉയർന്നുവരുന്ന ഫ്രണ്ടിയർ മോഡലുകൾക്ക് ഡേ-സീറോ മോഡൽ പിന്തുണയും ഇപ്പോൾ ഗൂഗിൾ ക്ലൗഡ് ടെൻസർ പ്രോസസ്സിംഗ് യൂണിറ്റുകൾ (TPU-കൾ) ഉൾപ്പെടെയുള്ള ആക്സിലറേറ്ററുകളുടെ വിശാലമായ പട്ടികയ്ക്കുള്ള പിന്തുണയും വാഗ്ദാനം ചെയ്യുന്ന, വളരെ പെട്ടെന്ന് തന്നെ സ്റ്റാൻഡേർഡ് ഓപ്പൺ സോഴ്‌സ് ഇൻഫെരൻസ് സെർവറായി മാറിയ vLLM.
  • ഇൻപുട്ട് സന്ദർഭത്തെ വേർതിരിക്കുന്നതിനും AI ടോക്കണൈസേഷനെ ഒന്നിലധികം സെർവറുകളിൽ വിതരണം ചെയ്യാൻ കഴിയുന്ന വ്യത്യസ്ത പ്രവർത്തനങ്ങളാക്കി മാറ്റുന്നതിനുമായി പ്രീഫിൽ ചെയ്ത് വേർതിരിച്ച ഡീകോഡിംഗ്
  • LMCache അടിസ്ഥാനമാക്കിയുള്ള KV (കീ-മൂല്യം) കാഷെ ഓഫ്‌ലോഡ്
  • ജോലിഭാരം കൂടുന്നതിനനുസരിച്ച് കമ്പ്യൂട്ട്, സ്റ്റോറേജ് റിസോഴ്‌സുകളുടെ കൂടുതൽ കാര്യക്ഷമമായ ഷെഡ്യൂളിംഗിനായി കുബർനെറ്റ്‌സ് അടിസ്ഥാനമാക്കിയുള്ള ക്ലസ്റ്ററുകളും കൺട്രോളറുകളും
  • അനുമാനത്തിന് മുമ്പുള്ള കമ്പ്യൂട്ടേഷനുകളുടെ സമീപകാല കാഷെകൾ ഉള്ള സെർവറുകളിലേക്കും ആക്സിലറേറ്ററുകളിലേക്കും വരുന്ന അഭ്യർത്ഥനകൾ ഷെഡ്യൂൾ ചെയ്യുന്നതിനുള്ള നെറ്റ്‌വർക്കുകൾക്കായുള്ള AI-കേന്ദ്രീകൃത റൂട്ടിംഗ്
  • ഉയർന്ന പ്രകടനമുള്ള ആശയവിനിമയ API-കൾ , NVIDIA ഇൻഫെറൻസ് എക്സ്ഫർ ലൈബ്രറി (NIXL)-നുള്ള പിന്തുണയോടെ.

llm-d: വ്യവസായ നേതാക്കൾക്കിടയിൽ ഏകകണ്ഠമായ അഭിപ്രായം

ഈ പുതിയ ഓപ്പൺ സോഴ്‌സ് പ്രോജക്റ്റിന് ഇതിനകം തന്നെ മുൻനിര AI മോഡലിംഗ് ദാതാക്കൾ, AI ആക്‌സിലറേറ്റർ പയനിയർമാർ, മുൻനിര AI-കേന്ദ്രീകൃത ക്ലൗഡ് പ്ലാറ്റ്‌ഫോമുകൾ എന്നിവയുടെ ശക്തമായ സഖ്യത്തിന്റെ പിന്തുണയുണ്ട്. കോർ‌വീവ്, ഗൂഗിൾ ക്ലൗഡ്, ഐ‌ബി‌എം റിസർച്ച്, എൻ‌വിഡിയ എന്നിവ സ്ഥാപക സംഭാവകരാണ്, എ‌എം‌ഡി, സിസ്‌കോ, ഹഗ്ഗിംഗ് ഫേസ്, ഇന്റൽ, ലാംഡ, മിസ്ട്രൽ എഐ എന്നിവ പങ്കാളികളായി, എൽ‌എൽ‌എം എക്സിക്യൂഷന്റെ ഭാവി സ്കെയിലിൽ രൂപപ്പെടുത്തുന്നതിന് ശക്തമായ വ്യവസായ സഹകരണം എടുത്തുകാണിക്കുന്നു. കാലിഫോർണിയ സർവകലാശാലയിലെ സ്കൈ കമ്പ്യൂട്ടിംഗ് ലാബ്, vLLM ന്റെ സ്രഷ്ടാക്കൾ, LMCache .

തുറന്ന സഹകരണത്തോടുള്ള അചഞ്ചലമായ പ്രതിബദ്ധതയ്ക്ക് അനുസൃതമായി, ജെൻ AI അനുമാനത്തിന്റെ അതിവേഗം വികസിച്ചുകൊണ്ടിരിക്കുന്ന മേഖലയിൽ ഊർജ്ജസ്വലവും ആക്‌സസ് ചെയ്യാവുന്നതുമായ കമ്മ്യൂണിറ്റികളുടെ നിർണായക പ്രാധാന്യം Red Hat തിരിച്ചറിയുന്നു. പുതിയ അംഗങ്ങൾക്ക് ഉൾക്കൊള്ളുന്ന ഒരു അന്തരീക്ഷം വളർത്തിയെടുക്കുന്നതിലൂടെയും അതിന്റെ തുടർച്ചയായ പരിണാമത്തെ നയിക്കുന്നതിലൂടെയും, llm-d കമ്മ്യൂണിറ്റിയുടെ വളർച്ചയെ Red Hat സജീവമായി പിന്തുണയ്ക്കും.

റെഡ് ഹാറ്റിന്റെ ദർശനം: ഏത് മോഡലും, ഏത് ആക്സിലറേറ്ററും, ഏത് മേഘവും

ഇൻഫ്രാസ്ട്രക്ചർ സിലോകളാൽ പരിമിതപ്പെടുത്താതെ, പരിധിയില്ലാത്ത അവസരങ്ങളാൽ AI യുടെ ഭാവി നിർവചിക്കണം. ഏതൊരു മോഡലിനെയും, ഏത് ആക്സിലറേറ്ററിനെയും, ഏത് ക്ലൗഡിനെയും വിന്യസിക്കാൻ കഴിയുന്ന ഒരു ഭാവിയാണ് Red Hat വിഭാവനം ചെയ്യുന്നത്, അമിത ചെലവുകളില്ലാതെ അസാധാരണവും കൂടുതൽ സ്ഥിരതയുള്ളതുമായ ഉപയോക്തൃ അനുഭവം നൽകുന്നു. Gen AI നിക്ഷേപങ്ങളുടെ യഥാർത്ഥ സാധ്യതകൾ അൺലോക്ക് ചെയ്യുന്നതിന്, കമ്പനികൾക്ക് ഒരു സാർവത്രിക അനുമാന പ്ലാറ്റ്‌ഫോം ആവശ്യമാണ് - ഇപ്പോഴും വരും വർഷങ്ങളിലും തുടർച്ചയായ, ഉയർന്ന പ്രകടനമുള്ള AI നവീകരണത്തിനുള്ള ഒരു പുതിയ മാനദണ്ഡം.

ലിനക്സിനെ ആധുനിക ഐടിയുടെ അടിത്തറയാക്കി മാറ്റുന്നതിൽ റെഡ് ഹാറ്റ് മുൻപന്തിയിൽ നിന്നതുപോലെ, ഭാവിയിലെ എഐ അനുമാനങ്ങൾ രൂപപ്പെടുത്താൻ കമ്പനി ഇപ്പോൾ തയ്യാറാണ്. ജനറൽ എഐയിലെ സ്റ്റാൻഡേർഡ് അനുമാനത്തിന്റെ ഒരു പ്രധാന ഘടകമായി മാറാൻ വിഎൽഎൽഎമ്മിന് കഴിവുണ്ട്, വിഎൽഎൽഎം കമ്മ്യൂണിറ്റിയെ ചുറ്റിപ്പറ്റി മാത്രമല്ല, വലിയ തോതിലുള്ള വിതരണം ചെയ്ത അനുമാനത്തിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന എൽഎൽഎം-ഡിയെ ചുറ്റിപ്പറ്റിയും അഭിവൃദ്ധി പ്രാപിക്കുന്ന ഒരു ആവാസവ്യവസ്ഥ കെട്ടിപ്പടുക്കാൻ റെഡ് ഹാറ്റ് പ്രതിജ്ഞാബദ്ധമാണ്. ദർശനം വ്യക്തമാണ്: എഐ മോഡൽ, അടിസ്ഥാന ആക്സിലറേറ്റർ അല്ലെങ്കിൽ വിന്യാസ പരിസ്ഥിതി എന്നിവ പരിഗണിക്കാതെ, പുതിയ ഹൈബ്രിഡ് ക്ലൗഡിൽ അനുമാനത്തിനുള്ള നിർണായക ഓപ്പൺ സ്റ്റാൻഡേർഡ് വിഎൽഎൽഎമ്മാക്കി മാറ്റാൻ റെഡ് ഹാറ്റ് ഉദ്ദേശിക്കുന്നു.

റെഡ് ഹാറ്റ് സമ്മിറ്റ്

Red Hat എക്സിക്യൂട്ടീവുകൾ, ഉപഭോക്താക്കൾ, പങ്കാളികൾ എന്നിവരിൽ നിന്ന് ഏറ്റവും പുതിയ വിവരങ്ങൾ കേൾക്കാൻ Red Hat ഉച്ചകോടിയിലെ പ്രധാന പരിപാടികളിൽ ചേരൂ:

ഇ-കൊമേഴ്‌സ് അപ്‌ഡേറ്റ്
ഇ-കൊമേഴ്‌സ് അപ്‌ഡേറ്റ്https://www.ecommerceupdate.org/
ഇ-കൊമേഴ്‌സ് അപ്‌ഡേറ്റ് ബ്രസീലിയൻ വിപണിയിലെ ഒരു മുൻനിര കമ്പനിയാണ്, ഇ-കൊമേഴ്‌സ് മേഖലയെക്കുറിച്ചുള്ള ഉയർന്ന നിലവാരമുള്ള ഉള്ളടക്കം നിർമ്മിക്കുന്നതിലും പ്രചരിപ്പിക്കുന്നതിലും വൈദഗ്ദ്ധ്യം നേടിയിട്ടുണ്ട്.
ബന്ധപ്പെട്ട ലേഖനങ്ങൾ

ഒരു മറുപടി നൽകുക

ദയവായി നിങ്ങളുടെ അഭിപ്രായം രേഖപ്പെടുത്തുക!
ദയവായി നിങ്ങളുടെ പേര് ഇവിടെ നൽകുക.

സമീപകാലം

ഏറ്റവും ജനപ്രിയമായത്

[elfsight_cookie_consent id="1"]