
Fframwaith NVIDIA NeMo

Manylebau
- Enw CynnyrchFframwaith NVIDIA NeMo
- Llwyfannau yr effeithir arnynt: Windows, Linux, macOS
- Fersiynau yr Effeithir Arnynt: Pob fersiwn cyn 24
- Bregusrwydd Diogelwch: CVE-2025-23360
- Sgôr Sylfaenol Asesiad Risg: 7.1 (CVSS fersiwn 3.1)
Cyfarwyddiadau Defnydd Cynnyrch
Gosod Diweddariad Diogelwch:
I amddiffyn eich system, dilynwch y camau hyn:
- Lawrlwythwch y datganiad diweddaraf o dudalen Rhyddhau NeMo-Framework-Launcher ar GitHub.
- Ewch i NVIDIA Product Security am ragor o wybodaeth.
Manylion Diweddariad Diogelwch:
Mae'r diweddariad diogelwch yn mynd i'r afael â gwendid yn Fframwaith NVIDIA NeMo a allai arwain at weithredu cod a dataampering.
Uwchraddio Meddalwedd:
Os ydych chi'n defnyddio rhyddhad cangen cynharach, argymhellir uwchraddio i'r rhyddhad cangen diweddaraf i fynd i'r afael â'r mater diogelwch.
Drosoddview
Mae Fframwaith NVIDIA NeMo yn fframwaith AI cynhyrchiol graddadwy a brodorol i'r cwmwl a adeiladwyd ar gyfer ymchwilwyr a datblygwyr sy'n gweithio ar Modelau Iaith Mawr, Amlfodd, a Deallusrwydd Artiffisial Lleferydd (ee Adnabyddiaeth Lleferydd Awtomatig a Testun-i-LeferyddMae'n galluogi defnyddwyr i greu, addasu a defnyddio modelau AI cynhyrchiol newydd yn effeithlon trwy fanteisio ar god presennol a phwyntiau gwirio modelau sydd wedi'u hyfforddi ymlaen llaw.
Cyfarwyddiadau Gosod: Gosod Fframwaith NeMo
Mae Fframwaith NeMo yn darparu cefnogaeth o'r dechrau i'r diwedd ar gyfer datblygu Modelau Iaith Mawr (LLMs) a Modelau Amlfodd (MMs). Mae'n darparu'r hyblygrwydd i'w ddefnyddio ar y safle, mewn canolfan ddata, neu gyda'ch darparwr cwmwl dewisol. Mae hefyd yn cefnogi gweithredu ar amgylcheddau sydd wedi'u galluogi gan SLURM neu Kubernetes.

Curadu Data
Curadur NeMo [1] yn llyfrgell Python sy'n cynnwys cyfres o fodiwlau ar gyfer cloddio data a chynhyrchu data synthetig. Maent yn raddadwy ac wedi'u optimeiddio ar gyfer GPUs, gan eu gwneud yn ddelfrydol ar gyfer curadu data iaith naturiol i hyfforddi neu fireinio LLMs. Gyda NeMo Curator, gallwch echdynnu testun o ansawdd uchel yn effeithlon o ddata crai helaeth web ffynonellau data.
Hyfforddiant ac Addasu
Mae Fframwaith NeMo yn darparu offer ar gyfer hyfforddi ac addasu effeithlon LLMs a modelau amlfoddol. Mae'n cynnwys ffurfweddiadau diofyn ar gyfer sefydlu clwstwr cyfrifiadurol, lawrlwytho data, a hyperbaramedrau modelu, y gellir eu haddasu i hyfforddi ar setiau data a modelau newydd. Yn ogystal â hyfforddi ymlaen llaw, mae NeMo yn cefnogi technegau Addasu Manwl Goruchwyliedig (SFT) a Addasu Manwl Effeithlon Paramedr (PEFT) fel LoRA, Addasu Manwl, a mwy.
Mae dau opsiwn ar gael i lansio hyfforddiant yn NeMo – gan ddefnyddio rhyngwyneb API NeMo 2.0 neu gyda NeMo Run.
- Gyda NeMo Run (Argymhellir): Mae NeMo Run yn darparu rhyngwyneb i symleiddio ffurfweddu, gweithredu a rheoli arbrofion ar draws amrywiol amgylcheddau cyfrifiadurol. Mae hyn yn cynnwys lansio swyddi ar eich gweithfan yn lleol neu ar glystyrau mawr – wedi'u galluogi gan SLURM neu Kubernetes mewn amgylchedd cwmwl.
- Hyfforddiant Cyn-amserol a Chychwyn Cyflym PEFT gyda NeMo Run
- Gan ddefnyddio'r API NeMo 2.0: Mae'r dull hwn yn gweithio'n dda gyda gosodiad syml sy'n cynnwys modelau bach, neu os oes gennych ddiddordeb mewn ysgrifennu eich llwythwr data personol eich hun, dolenni hyfforddi, neu newid haenau model. Mae'n rhoi mwy o hyblygrwydd a rheolaeth i chi dros gyfluniadau, ac yn ei gwneud hi'n hawdd ymestyn ac addasu cyfluniadau'n rhaglennol.
-
TraCychwyn Cyflym gyda NeMo 2.0 API
-
Mudo o NeMo 1.0 i NeMo 2.0 API
-
Aliniad
- NeMo-Aligner [1] yn becyn cymorth graddadwy ar gyfer aliniad modelau effeithlon. Mae'r pecyn cymorth yn cefnogi algorithmau aliniad modelau o'r radd flaenaf fel SteerLM, DPO, Reinforcement Learning from Human Feedback (RLHF), a llawer mwy. Mae'r algorithmau hyn yn galluogi defnyddwyr i alinio modelau iaith i fod yn fwy diogel, diniwed, a defnyddiol.
- Mae holl bwyntiau gwirio NeMo-Aligner yn gydnaws â'r ecosystem NeMo, gan ganiatáu ar gyfer addasu a defnyddio casgliadau pellach.
Llif gwaith cam wrth gam o bob un o'r tri cham o RLHF ar fodel GPT-2B bach:
- Hyfforddiant SFT
- Hyfforddiant model gwobrwyo
- Hyfforddiant PPO
Yn ogystal, rydym yn dangos cefnogaeth i amryw o ddulliau alinio newydd eraill:
- DPO: algorithm aliniad ysgafn o'i gymharu â RLHF gyda swyddogaeth golled symlach.
- Hunan-Chwarae Addasu Manwl (SPIN)
- LlywioLM: techneg yn seiliedig ar SFT cyflyredig, gydag allbwn llywadwy.
Edrychwch ar y ddogfennaeth am ragor o wybodaeth: Dogfennaeth Aliniad
Modelau Amlfodd
- Mae Fframwaith NeMo yn darparu meddalwedd wedi'i optimeiddio i hyfforddi a defnyddio modelau amlfodd o'r radd flaenaf ar draws sawl categori: Modelau Iaith Amlfodd, Seiliau Gweledigaeth-Iaith, modelau Testun-i-Delwedd, a thu hwnt i Gynhyrchu 2D gan ddefnyddio Meysydd Ymlewyrch Niwral (NeRF).
- Mae pob categori wedi'i gynllunio i ddiwallu anghenion a datblygiadau penodol yn y maes, gan fanteisio ar fodelau arloesol i drin ystod eang o fathau o ddata, gan gynnwys testun, delweddau a modelau 3D.
Nodyn
Rydym yn symud cefnogaeth ar gyfer modelau amlfoddol o NeMo 1.0 i NeMo 2.0. Os ydych chi am archwilio'r maes hwn yn y cyfamser, cyfeiriwch at y ddogfennaeth ar gyfer y fersiwn flaenorol o NeMo 24.07.
Defnyddio a Chasglu
Mae Fframwaith NeMo yn darparu amrywiol lwybrau ar gyfer casglu LLM, gan ddiwallu anghenion gwahanol senarios defnyddio ac perfformiad.
Defnyddio gyda NVIDIA NIM
- Mae Fframwaith NeMo yn integreiddio'n ddi-dor ag offer defnyddio modelau lefel menter trwy NVIDIA NIM. Mae'r integreiddio hwn yn cael ei bweru gan NVIDIA TensorRT-LLM, gan sicrhau casgliad wedi'i optimeiddio a graddadwy.
- Am ragor o wybodaeth am NIM, ewch i NVIDIA websafle.
Defnyddio gyda TensorRT-LLM neu vLLM
- Mae Fframwaith NeMo yn cynnig sgriptiau ac APIs i allforio modelau i ddwy lyfrgell sydd wedi'u optimeiddio ar gyfer casgliadau, TensorRT-LLM a vLLM, ac i ddefnyddio'r model a allforiwyd gyda Gweinydd Casgliadau Triton NVIDIA.
- Ar gyfer senarios sydd angen perfformiad wedi'i optimeiddio, gall modelau NeMo fanteisio ar TensorRT-LLM, llyfrgell arbenigol ar gyfer cyflymu ac optimeiddio casgliad LLM ar GPUs NVIDIA. Mae'r broses hon yn cynnwys trosi modelau NeMo i fformat sy'n gydnaws â TensorRT-LLM gan ddefnyddio'r modiwl nemo.export.
- Defnyddio LLM Ar Drawsview
- Defnyddio Modelau Iaith Mawr NeMo gyda NIM
- Defnyddio Modelau Iaith Mawr NeMo gyda TensorRT-LLM
- Defnyddio Modelau Iaith Mawr NeMo gyda vLLM
Modelau â Chymorth
Modelau Iaith Mawr
| Modelau Iaith Mawr | Cyn-hyfforddi a SFT | PEFT | Aliniad | Cydgyfeirio Hyfforddiant FP8 | TRT/TRTLLM | Trosi I ac O Wyneb Cwtsio | Gwerthusiad |
|---|---|---|---|---|---|---|---|
| Llama3 8B/70B, Llama3.1 405B | Oes | Oes | x | Ydw (wedi'i wirio'n rhannol) | Oes | Y ddau | Oes |
| Mixtral 8x7B/8x22B | Oes | Oes | x | Ie (heb ei wirio) | Oes | Y ddau | Oes |
| Nemotron 3 8B | Oes | x | x | Ie (heb ei wirio) | x | Y ddau | Oes |
| Nemotron 4 340B | Oes | x | x | Ie (heb ei wirio) | x | Y ddau | Oes |
| Baichuan2 7B | Oes | Oes | x | Ie (heb ei wirio) | x | Y ddau | Oes |
| SgwrsGLM3 6B | Oes | Oes | x | Ie (heb ei wirio) | x | Y ddau | Oes |
| Gemma 2B/7B | Oes | Oes | x | Ie (heb ei wirio) | Oes | Y ddau | Oes |
| Gemma2 2B/9B/27B | Oes | Oes | x | Ie (heb ei wirio) | x | Y ddau | Oes |
| Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B | Oes | Oes | x | Ie (heb ei wirio) | x | x | Oes |
| Phi3 mini 4k | x | Oes | x | Ie (heb ei wirio) | x | x | x |
| Qwen2 0.5B/1.5B/7B/72B | Oes | Oes | x | Ie (heb ei wirio) | Oes | Y ddau | Oes |
| StarCoder 15B | Oes | Oes | x | Ie (heb ei wirio) | Oes | Y ddau | Oes |
| StarCoder2 3B/7B/15B | Oes | Oes | x | Ie (heb ei wirio) | Oes | Y ddau | Oes |
| BERT 110M/340M | Oes | Oes | x | Ie (heb ei wirio) | x | Y ddau | x |
| T5 220M/3B/11B | Oes | Oes | x | x | x | x | x |
Modelau Iaith Gweledigaeth
| Modelau Iaith Gweledigaeth | Cyn-hyfforddi a SFT | PEFT | Aliniad | Cydgyfeirio Hyfforddiant FP8 | TRT/TRTLLM | Trosi I ac O Wyneb Cwtsio | Gwerthusiad |
|---|---|---|---|---|---|---|---|
| NeVA (LLaVA 1.5) | Oes | Oes | x | Ie (heb ei wirio) | x | Oddiwrth | x |
| Llama 3.2 Vision 11B/90B | Oes | Oes | x | Ie (heb ei wirio) | x | Oddiwrth | x |
| LLaVA Nesaf (LLaVA 1.6) | Oes | Oes | x | Ie (heb ei wirio) | x | Oddiwrth | x |
Mewnosod Modelau
| Mewnosod Modelau Iaith | Cyn-hyfforddi a SFT | PEFT | Aliniad | Cydgyfeirio Hyfforddiant FP8 | TRT/TRTLLM | Trosi I ac O Wyneb Cwtsio | Gwerthusiad |
|---|---|---|---|---|---|---|---|
| SBERT 340M | Oes | x | x | Ie (heb ei wirio) | x | Y ddau | x |
| Llama 3.2 Mewnosod 1B | Oes | x | x | Ie (heb ei wirio) | x | Y ddau | x |
Modelau Sefydliad y Byd
| Modelau Sefydliad y Byd | Ôl-Hyfforddiant | Casgliad Cyflym |
|---|---|---|
| Cosmos-1.0-Trylediad-Testun2World-7B | Oes | Oes |
| Cosmos-1.0-Trylediad-Testun2World-14B | Oes | Oes |
| Cosmos-1.0-Trylediad-Fideo2World-7B | Yn Dod yn Fuan | Yn Dod yn Fuan |
| Cosmos-1.0-Trylediad-Fideo2World-14B | Yn Dod yn Fuan | Yn Dod yn Fuan |
| Cosmos-1.0-Awto-atchweliadol-4B | Oes | Oes |
| Cosmos-1.0-Awto-atchweliadol-Fideo2World-5B | Yn Dod yn Fuan | Yn Dod yn Fuan |
| Cosmos-1.0-Awto-atchweliadol-12B | Oes | Oes |
| Cosmos-1.0-Awto-atchweliadol-Fideo2World-13B | Yn Dod yn Fuan | Yn Dod yn Fuan |
Nodyn
Mae NeMo hefyd yn cefnogi hyfforddi ymlaen llaw ar gyfer pensaernïaethau trylediad ac awto-atchweliad. text2world modelau sylfaen.
Deallusrwydd Artiffisial Lleferydd
Mae datblygu modelau AI sgwrsiol yn broses gymhleth sy'n cynnwys diffinio, adeiladu a hyfforddi modelau o fewn meysydd penodol. Mae'r broses hon fel arfer yn gofyn am sawl ailadrodd i gyrraedd lefel uchel o gywirdeb. Yn aml mae'n cynnwys sawl ailadrodd i gyflawni cywirdeb uchel, mireinio gwahanol dasgau a data penodol i'r parth, sicrhau perfformiad hyfforddi, a pharatoi modelau ar gyfer defnyddio casgliadau.

Mae Fframwaith NeMo yn darparu cefnogaeth ar gyfer hyfforddi ac addasu modelau AI Lleferydd. Mae hyn yn cynnwys tasgau fel Adnabod Lleferydd Awtomatig (ASR) a synthesis Testun-i-Leferydd (TTS). Mae'n cynnig trosglwyddiad llyfn i ddefnyddio cynhyrchu ar lefel menter gyda NVIDIA Riva. I gynorthwyo datblygwyr ac ymchwilwyr, mae Fframwaith NeMo yn cynnwys pwyntiau gwirio wedi'u hyfforddi ymlaen llaw o'r radd flaenaf, offer ar gyfer prosesu data lleferydd atgynhyrchadwy, a nodweddion ar gyfer archwilio a dadansoddi setiau data lleferydd yn rhyngweithiol. Dyma gydrannau Fframwaith NeMo ar gyfer AI Lleferydd:
Hyfforddiant ac Addasu
Mae Fframwaith NeMo yn cynnwys popeth sydd ei angen i hyfforddi ac addasu modelau lleferydd (ASR, Dosbarthiad Lleferydd, Adnabyddiaeth Siaradwr, Dyddiadur y Siaradwr, a TTS) mewn modd atgynhyrchadwy.
Modelau SOTA wedi'u Hyfforddi ymlaen llaw
- Mae Fframwaith NeMo yn darparu ryseitiau o'r radd flaenaf a phwyntiau gwirio wedi'u hyfforddi ymlaen llaw ar gyfer sawl un ASR a TTS modelau, yn ogystal â chyfarwyddiadau ar sut i'w llwytho.
- Offer Lleferydd
- Mae Fframwaith NeMo yn darparu set o offer sy'n ddefnyddiol ar gyfer datblygu modelau ASR a TTS, gan gynnwys:
- Alinydd Gorfodol NeMo (NFA) ar gyfer cynhyrchu amseroedd lefel tocyn, gair a segmentampo leferydd mewn sain gan ddefnyddio modelau Adnabod Lleferydd Awtomatig NeMo sy'n seiliedig ar CTC.
- Prosesydd Data Lleferydd (SDP), pecyn cymorth ar gyfer symleiddio prosesu data lleferydd. Mae'n caniatáu ichi gynrychioli gweithrediadau prosesu data mewn cyfluniad file, gan leihau cod boilerplate a chaniatáu atgynhyrchadwyedd a rhannu.
- Archwiliwr Data Lleferydd (SDE), sy'n seiliedig ar Dash web cymhwysiad ar gyfer archwilio a dadansoddi rhyngweithiol setiau data lleferydd.
- Offeryn creu set ddata sy'n darparu swyddogaeth i alinio sain hir files gyda'r trawsgrifiadau cyfatebol a'u rhannu'n ddarnau byrrach sy'n addas ar gyfer hyfforddiant model Adnabod Lleferydd Awtomatig (ASR).
- Offeryn Cymharu i Fodelau ASR gymharu rhagfynegiadau gwahanol fodelau ASR ar lefel cywirdeb geiriau ac ynganiad.
- Gwerthuswr ASR ar gyfer gwerthuso perfformiad modelau ASR a nodweddion eraill fel Canfod Gweithgaredd Llais.
- Offeryn Normaleiddio Testun ar gyfer trosi testun o'r ffurf ysgrifenedig i'r ffurf lafar ac i'r gwrthwyneb (e.e. “31ain” yn erbyn “unfed ar hugain”).
- Llwybr i'w Ddefnyddio
- Gellir optimeiddio a defnyddio modelau NeMo sydd wedi'u hyfforddi neu eu haddasu gan ddefnyddio Fframwaith NeMo gyda NVIDIA Riva. Mae Riva yn darparu cynwysyddion a siartiau Helm sydd wedi'u cynllunio'n benodol i awtomeiddio'r camau ar gyfer defnyddio botwm gwthio.
Adnoddau Eraill
- NeMoY brif storfa ar gyfer Fframwaith NeMo
- NeMo–RhedegOfferyn i ffurfweddu, lansio a rheoli eich arbrofion dysgu peirianyddol.
- NeMo-Aligner: Pecyn cymorth graddadwy ar gyfer aliniad model effeithlon
- Curadur NeMo: Pecyn cymorth cyn-brosesu a churadu data graddadwy ar gyfer LLMs
Ymgysylltwch â chymuned NeMo, gofynnwch gwestiynau, ceisiwch gymorth, neu rhowch wybod am fygiau.
- Trafodaethau NeMo
- Problemau NeMo
Ieithoedd Rhaglennu a Fframweithiau
- PythonY prif ryngwyneb i ddefnyddio Fframwaith NeMo
- PytorchMae Fframwaith NeMo wedi'i adeiladu ar ben PyTorch
Trwyddedau
- Mae repo NeMo Github wedi'i drwyddedu o dan drwydded Apache 2.0
- Mae Fframwaith NeMo wedi'i drwyddedu o dan GYTUNDEB CYNHYRCHION AI NVIDIA. Drwy dynnu a defnyddio'r cynhwysydd, rydych chi'n derbyn telerau ac amodau'r drwydded hon.
- Mae cynhwysydd Fframwaith NeMo yn cynnwys deunyddiau Llama sy'n cael eu llywodraethu gan Gytundeb Trwydded Gymunedol Meta Llama3.
Troednodiadau
Ar hyn o bryd, mae cefnogaeth NeMo Curator a NeMo Aligner ar gyfer modelau Amlfodd yn waith sy'n mynd rhagddo a bydd ar gael yn fuan iawn.
FAQ
C: Sut alla i wirio a yw'r bregusrwydd yn effeithio ar fy system?
A: Gallwch wirio a yw eich system wedi'i heffeithio drwy wirio fersiwn Fframwaith NVIDIA NeMo sydd wedi'i osod. Os yw'n is na fersiwn 24, efallai bod eich system yn agored i niwed.
Q: Pwy adroddodd y mater diogelwch CVE-2025-23360?
A: Adroddwyd am y broblem diogelwch gan Or Peles – JFrog Security. Mae NVIDIA yn cydnabod eu cyfraniad.
C: Sut alla i dderbyn hysbysiadau bwletin diogelwch yn y dyfodol?
A: Ewch i dudalen Diogelwch Cynnyrch NVIDIA i danysgrifio i hysbysiadau bwletin diogelwch a chael gwybod am ddiweddariadau diogelwch cynnyrch.
Dogfennau / Adnoddau
![]() | Fframwaith NeMo |
Cyfeiriadau
- Llawlyfr Defnyddiwrmanual.tools

