NVIDIA 推出面向 RTX AI PC 的 AI 基础模型

2025-01-07 15:30:18 [ 中关村在线原创 ] 作者：曲楠

拉斯维加斯—CES—2025 年 1 月 6 日— NVIDIA 今日发布能在 NVIDIA RTX™ AI PC 本地运行的基础模型，为数字人、内容创作、生产力和开发提供强大助力。

这些基础模型以NVIDIA NIM™微服务的形式提供，由全新GeForce RTX™ 50 系列GPU加速，提供最高可达2375 AITOPS和32GB显存。基于NVIDIA Blackwell架构的RTX50系列GPU是首批支持FP4计算精度的消费级GPU。与上一代产品相比，AI推理性能提升2倍，并让生成式AI模型在本地以更小的显存占用空间运行。

长期以来，GeForce™一直是AI开发者的重要平台。早在2012年，首个由GPU加速的深度学习网络AlexNet 就是在GeForce GTX 580 上进行训练的。在去年发表的AI 研究论文中，超过30% 都提及了对GeForce RTX 的使用。

现如今，在生成式AI和RTXAIPC的助力下，任何人都能成为开发者。借助AnythingLLM、ComfyUI和LangFlow等新一代低代码和无代码工具，发烧友能够通过简单的图形用户界面(GUI) 在复杂的工作流中使用AI 模型。

连接到这些GUI的NIM微服务使获取和部署最新生成式AI模型轻而易举。NVIDIA AI Blueprint基于NIM微服务构建，旨在为数字人、内容创作等应用提供易于使用的预配置参考工作流。

为满足AI 开发者和发烧友日益增长的需求，领先PC 制造商和系统集成商即将推出搭载GeForce RTX50系列GPU且支持NIM的RTXAI PC。

NVIDIA创始人兼首席执行官黄仁勋表示，“AI正在以光速发展，从感知式AI到生成式AI，再到如今的代理式AI。NIM微服务和AIBlueprint为PC开发者和发烧友探索AI提供了基础模块。”

NIM提供迅捷AI体验

基础模型，即使用海量原始数据训练而成的神经网络，是生成式AI的基础模块。

NVIDIA将发布一系列来自包括BlackForestLabs、Meta、Mistral和StabilityAI等顶尖模型开发者的适用于RTXAIPC的NVIDIA NIM微服务。涵盖大语言模型(LLM)、视觉语言模型、图像生成、语音、检索增强生成(RAG) 的嵌入模型、PDF提取和计算机视觉等应用场景。

BlackForestLabs首席执行官RobinRombach表示，“支持FP4计算精度的GeForce RTX 50系列GPU将使一大批此前仅适用于大型数据中心的模型得以在PC上运行。把Flux打造成NVIDIA NIM微服务，让更多用户以更快的速度部署和体验AI，同时提供超乎想象的性能。”

NVIDIA今天还宣布推出Llama Nemotron，这是一系列开放许可的基础模型，能够在各类代理式任务中提供极高的精度。LlamaNemotron Nano 模型将作为面向RTXAI PC 和工作站的NIM微服务提供，在指令遵循、工具调用、聊天、代码和数学等代理式AI任务方面表现出众。

NIM微服务包含在PC上运行AI所需的关键组件，并针对NVIDIAGPU的部署进行优化，无论GPU在RTXPC、工作站，还是在云端。

开发者和发烧友将能快速下载这些NIM微服务，并可在带有适用于Linux的Windows子系统(WSL)的Windows11PC上设置和运行。

微软副总裁，Windows业务负责人Pavan Davuluri表示：“AI正在快速驱动Windows 11 PC 创新，适用于Linux的Windows子系统(WSL)和WindowsCopilotRuntime为Windows11上的AI开发提供出色的跨平台环境。NVIDIANIM 微服务为Windows PC提供优化，为开发者和发烧友提供可立即集成到其Windows应用中的AI模型，从而进一步加速Windows用户的AI功能部署。”

运行在RTX AI PC 上的NIM 微服务将兼容先进AI 开发和智能体框架，包括AI Toolkit forVSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、LangFlow 和LMStudio。开发者可以通过行业标准端点，将基于上述框架构建的应用和工作流连接到运行NIM 微服务的AI模型，无论在云端、数据中心、工作站还是PC上，都可通过统一的接口使用最新技术。

发烧友还可通过即将发布的NVIDIAChatRTX技术Demo体验一系列NIM微服务。

让代理式AI拥有拟人表情

为了向RTX发烧友和开发者展示使用NIM微服务构建AI智能体和助手的方法，NVIDIA今天首度公开ProjectR2X。这是一款具有视觉能力的PC虚拟形象，它可以让用户需要的信息触手可及、协助用户使用桌面应用、进行视频会议、阅读和总结文档等。

该虚拟形象采用全新生成式AI 算法NVIDIARTX Neural Faces渲染而成，这种算法可利用完全生成的像素来增强传统光栅化渲染。然后，面部通过基于扩散原理的全新NVIDIAAudio2Face™-3D模型驱动动画，该模型可改善唇部和舌头动作。R2X可以通过CrewAI、FlowiseAI 和LangFlow等开发者框架连接到OpenAI的GPT4o或xAI的Grok等云端AI服务，以及NIM微服务和AIBlueprint，如PDF检索器或其他LLM。注册以关注ProjectR2X 的更新。

AIBlueprint 即将登陆PC

NIM 微服务还可通过AI Blueprint（可在RTX PC 上本地运行的参考AI 工作流）供PC 用户使用。借助这些蓝图，开发者能够基于PDF 文档创建播客、生成由3D 场景引导的令人惊艳的图像等。

将PDF转换为播客的蓝图可从PDF中提取文本、图像和表格，创建可供用户编辑的播客脚本。它还能根据此脚本，使用蓝图中提供的语音或基于用户的语音样本生成完整的音频录音。此外，用户还能与AI播客主持人进行实时对话，了解有关特定主题的更多信息。

该蓝图利用像Mistral-Nemo-12B-Instruct这样的NIM微服务来处理语言，借助NVIDIA Riva进行文本转语音和自动语音识别，以及使用NeMoRetriever微服务集合进行PDF提取。

使用由3D引导的生成式AIBlueprint，艺术家能对图像生成进行更精细的控制。虽然AI可以通过简单的文本提示生成令人惊叹的图像，但仅使用文字控制图像的内容极具挑战。有了上述蓝图，创作者可以借助使用Blender等3D渲染器布置简单的3D物体来引导AI图像生成。艺术家可手动或使用AI生成创建3D资产，将其放置在场景中，并设置3Dviewport相机。由FluxNIM 微服务提供支持的预打包工作流将可以通过插件(例如Blender中由开发者ACGGit开发的ComfyUI-BlenderAI-node)使用当前布景生成与3D场景相匹配的高质量图像。

NVIDIA NIM微服务和AIBlueprint将从2月起开始提供，首发支持的硬件包含GeForceRTX50 系列、GeForceRTX 4090 和4080以及NVIDIA RTX 6000 和5000GPU ，未来还会陆续提供对其他GPU的支持。宏碁、华硕、戴尔、惠普、联想、微星、雷蛇将推出支持NIM 的RTX AI PC。

关注NVIDIACES动向，了解NIM微服务、AIBlueprint以及支持NIM的RTXAIPC如何加速生成式AI。

本文属于原创文章，如若转载，请注明来源：NVIDIA 推出面向 RTX AI PC 的 AI 基础模型https://diy.zol.com.cn/936/9366388.html