NVIDIA NeMo微服務為開發人員提供一個端對端平台,能建立最先進的代理型AI系統,並結合商業資料推論、使用者偏好持續優化模型,使 AI 代理從互動中不斷學習與精進,進而成為企業內部數位團隊的一員。作為建立 AI 代理的建構模組,NeMo 微服務幫助企業利用商業智慧與包括 NVIDIA Llama Nemotron 在內的世界級推理模型完成更多工作。

企業若缺乏來自資料庫、使用者互動或現實訊號等高品質輸入,將影響AI代理的理解與應對品質。NeMo 微服務著眼於此,協助開發人員蒐集並運用三大類資料:推論資料、最新業務資料、與使用者回饋資料,以實現資料驅動的持續學習。

NeMo 提供包括 NeMo Customizer、Evaluator、Guardrails 等模組,搭配 Retriever 與 Curator 進行客製化資料飛輪建構,快速打造企業專屬AI代理系統。應用場景如下:

NeMo Customizer:支援監督式微調與LoRA後訓練技術,訓練輸送量提升1.8倍。

NeMo Evaluator:簡化模型評估流程,僅需5次API請求。

NeMo Guardrails:於延遲僅半秒的情況下,合規性提升1.4倍。

這些模組均可部署於 NVIDIA AI Enterprise 軟體平台,支援在本地或雲端的加速運算架構上運行,並具備企業級安全性、穩定性與技術支援。

NeMo 微服務的開放正值多代理AI系統快速興起之際,未來企業將部署數百個具有明確任務與目標的AI代理,成為與人類員工協作的數位隊友,廣泛應用於詐欺偵測、購物助理、預測性維護與文件審查等場景,催生上兆美元的市場潛力。

多家產業巨頭已導入NeMo 微服務,建立反應迅速的AI代理平台,提升內部營運與服務品質。

AT&T與 Arize、Quantiphi 合作,利用NeMo微服務建構可擴展的AI代理系統,處理包含上萬份文件的知識庫,並透過微調Mistral 7B模型,將準確率提升40%。貝萊德在 Aladdin 技術平台上導入NeMo 微服務,結合通用資料語言整合投資流程。思科 Outshift 團隊與 Galileo 合作建置AI編碼助理,錯誤率降幅達40%,回應速度提升10倍。納斯達克運用 NeMo Retriever 與 NIM 微服務強化其 Gen AI 平台,提升搜尋準確率與反應速度30%。

NeMo 微服務支援包括 Llama、Phi、Gemma、Mistral 與 Llama Nemotron Ultra 等熱門開源模型,並與 Meta 的 Llamastack 整合,提供完整API以實現客製化開發。

Meta GenAI 工程師 Raghotham Murthy 表示:「透過 NeMo 微服務支援的資料飛輪,工程師能持續提升模型效能,降低總持有成本。」

此外,Cloudera、Datadog、Dataiku、Weights & Biases 等多家平台已與 NeMo 整合,開發人員亦可於 LangChain、CrewAI、LlamaIndex 等框架中運用 NeMo 微服務。

NVIDIA 同時與儲存設備夥伴合作,提供 NVIDIA AI Data Platform 建構資料飛輪,包括 DDN、戴爾、IBM、Pure Storage 等供應商均為認證合作夥伴。

如Amdocs、Cadence、SAP、ServiceNow 與 Synopsys 等平台,也皆已於其AI代理系統導入 NeMo 微服務。顧問業者如埃森哲、德勤與安永也將其作為企業AI策略規劃工具。

開發人員可自 NVIDIA NGC 平台免費下載 NeMo 微服務,作為 NVIDIA AI Enterprise 部署的一部分,享有長期支援、API穩定性與安全修補,協助企業構建下一代AI代理系統。