拉斯维加斯—CES—2025 年 1 月 6 日— NVIDIA 今日发布能在 NVIDIA RTX™ AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。
这些基础模型以NVIDIA NIM™微服务的形式提供,由全新GeForce RTX™ 50 系列GPU加速,提供最高可达2375 AITOPS和32GB显存。基于NVIDIA Blackwell架构的RTX50系列GPU是首批支持FP4计算精度的消费级GPU。与上一代产品相比,AI推理性能提升2倍,并让生成式AI模型在本地以更小的显存占用空间运行。
长期以来,GeForce™一直是AI开发者的重要平台。早在2012年,首个由GPU加速的深度学习网络AlexNet 就是在GeForce GTX 580 上进行训练的。在去年发表的AI 研究论文中,超过30% 都提及了对GeForce RTX 的使用。
现如今,在生成式AI和RTXAIPC的助力下,任何人都能成为开发者。借助AnythingLLM、ComfyUI和LangFlow等新一代低代码和无代码工具,发烧友能够通过简单的图形用户界面(GUI) 在复杂的工作流中使用AI 模型。
连接到这些GUI的NIM微服务使获取和部署最新生成式AI模型轻而易举。NVIDIA AI Blueprint基于NIM微服务构建,旨在为数字人、内容创作等应用提供易于使用的预配置参考工作流。
为满足AI 开发者和发烧友日益增长的需求,领先PC 制造商和系统集成商即将推出搭载GeForce RTX50系列GPU且支持NIM的RTXAI PC。
NVIDIA创始人兼首席执行官黄仁勋表示,“AI正在以光速发展,从感知式AI到生成式AI,再到如今的代理式AI。NIM微服务和AIBlueprint为PC开发者和发烧友探索AI提供了基础模块。”
NIM提供迅捷AI体验
基础模型,即使用海量原始数据训练而成的神经网络,是生成式AI的基础模块。
NVIDIA将发布一系列来自包括BlackForestLabs、Meta、Mistral和StabilityAI等顶尖模型开发者的适用于RTXAIPC的NVIDIA NIM微服务。涵盖大语言模型(LLM)、视觉语言模型、图像生成、语音、检索增强生成(RAG) 的嵌入模型、PDF提取和计算机视觉等应用场景。
BlackForestLabs首席执行官RobinRombach表示,“支持FP4计算精度的GeForce RTX 50系列GPU将使一大批此前仅适用于大型数据中心的模型得以在PC上运行。把Flux打造成NVIDIA NIM微服务,让更多用户以更快的速度部署和体验AI,同时提供超乎想象的性能。”
NVIDIA今天还宣布推出Llama Nemotron,这是一系列开放许可的基础模型,能够在各类代理式任务中提供极高的精度。LlamaNemotron Nano 模型将作为面向RTXAI PC 和工作站的NIM微服务提供,在指令遵循、工具调用、聊天、代码和数学等代理式AI任务方面表现出众。
NIM微服务包含在PC上运行AI所需的关键组件,并针对NVIDIAGPU的部署进行优化,无论GPU在RTXPC、工作站,还是在云端。
开发者和发烧友将能快速下载这些NIM微服务,并可在带有适用于Linux的Windows子系统(WSL)的Windows11PC上设置和运行。
微软副总裁,Windows业务负责人Pavan Davuluri表示:“AI正在快速驱动Windows 11 PC 创新,适用于Linux的Windows子系统(WSL)和WindowsCopilotRuntime为Windows11上的AI开发提供出色的跨平台环境。NVIDIANIM 微服务为Windows PC提供优化,为开发者和发烧友提供可立即集成到其Windows应用中的AI模型,从而进一步加速Windows用户的AI功能部署。”
运行在RTX AI PC 上的NIM 微服务将兼容先进AI 开发和智能体框架,包括AI Toolkit forVSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、LangFlow 和LMStudio。开发者可以通过行业标准端点,将基于上述框架构建的应用和工作流连接到运行NIM 微服务的AI模型,无论在云端、数据中心、工作站还是PC上,都可通过统一的接口使用最新技术。
发烧友还可通过即将发布的NVIDIAChatRTX技术Demo体验一系列NIM微服务。
让代理式AI拥有拟人表情
为了向RTX发烧友和开发者展示使用NIM微服务构建AI智能体和助手的方法,NVIDIA今天首度公开ProjectR2X。这是一款具有视觉能力的PC虚拟形象,它可以让用户需要的信息触手可及、协助用户使用桌面应用、进行视频会议、阅读和总结文档等。
该虚拟形象采用全新生成式AI 算法NVIDIARTX Neural Faces渲染而成,这种算法可利用完全生成的像素来增强传统光栅化渲染。然后,面部通过基于扩散原理的全新NVIDIAAudio2Face™-3D模型驱动动画,该模型可改善唇部和舌头动作。R2X可以通过CrewAI、FlowiseAI 和LangFlow等开发者框架连接到OpenAI的GPT4o或xAI的Grok等云端AI服务,以及NIM微服务和AIBlueprint,如PDF检索器或其他LLM。注册以关注ProjectR2X 的更新。
AIBlueprint 即将登陆PC
NIM 微服务还可通过AI Blueprint(可在RTX PC 上本地运行的参考AI 工作流)供PC 用户使用。借助这些蓝图,开发者能够基于PDF 文档创建播客、生成由3D 场景引导的令人惊艳的图像等。
将PDF转换为播客的蓝图可从PDF中提取文本、图像和表格,创建可供用户编辑的播客脚本。它还能根据此脚本,使用蓝图中提供的语音或基于用户的语音样本生成完整的音频录音。此外,用户还能与AI播客主持人进行实时对话,了解有关特定主题的更多信息。
该蓝图利用像Mistral-Nemo-12B-Instruct这样的NIM微服务来处理语言,借助NVIDIA Riva进行文本转语音和自动语音识别,以及使用NeMoRetriever微服务集合进行PDF提取。
使用由3D引导的生成式AIBlueprint,艺术家能对图像生成进行更精细的控制。虽然AI可以通过简单的文本提示生成令人惊叹的图像,但仅使用文字控制图像的内容极具挑战。有了上述蓝图,创作者可以借助使用Blender等3D渲染器布置简单的3D物体来引导AI图像生成。艺术家可手动或使用AI生成创建3D资产,将其放置在场景中,并设置3Dviewport相机。由FluxNIM 微服务提供支持的预打包工作流将可以通过插件(例如Blender中由开发者ACGGit开发的ComfyUI-BlenderAI-node)使用当前布景生成与3D场景相匹配的高质量图像。
NVIDIA NIM微服务和AIBlueprint将从2月起开始提供,首发支持的硬件包含GeForceRTX50 系列、GeForceRTX 4090 和4080以及NVIDIA RTX 6000 和5000GPU ,未来还会陆续提供对其他GPU的支持。宏碁、华硕、戴尔、惠普、联想、微星、雷蛇将推出支持NIM 的RTX AI PC。
关注NVIDIACES动向,了解NIM微服务、AIBlueprint以及支持NIM的RTXAIPC如何加速生成式AI。
本文属于原创文章,如若转载,请注明来源:NVIDIA 推出面向 RTX AI PC 的 AI 基础模型https://diy.zol.com.cn/936/9366388.html