再放大招！NVIDIA联手微软助力AI应用开发

2024-11-27 14:00:40 [ 中关村在线原创 ] 作者：曲楠

在今年的Microsoft Ignite 大会上，NVIDIA与微软联合推出多个工具，帮助Windows 开发者在RTX AI PC 上快速构建和优化AI 赋能的应用，使本地AI 更加便捷。这些新工具使应用和游戏开发者能够利用强大的RTX GPU 加速AI 智能体、应用助手和数字人等应用的复杂AI 工作流。

MicrosoftIgnite是由Microsoft主办的面向IT决策者、IT专业人员、企业开发人员的顶级技术大会。今年的大会地址选在了芝加哥，不仅有微软的大咖介绍最新的技术，同时也会联合合作伙伴，对最新的技术路线、概念方向进行吹风。

再放大招！NVIDIA联手微软助力AI应用开发

而在今年的Microsoft Ignite 大会上，NVIDIA与微软联合推出了多个工具，旨在帮助Windows 开发者在RTX AI PC 上快速构建和优化AI 应用，使本地AI 更加便捷。这些新工具使应用和游戏开发者能够利用强大的RTX GPU 加速AI 智能体、应用助手和数字人等应用的复杂AI 工作流。

RTX AI PC通过多模态小语言模型为数字人赋能

NVIDIA ACE是一套数字人技术，可以让智能体、助手和虚拟形象栩栩如生。为了深度理解信息，以更强的情境感知能力做出响应，数字人必须能够像人一样在视觉上感知世界。

再放大招！NVIDIA联手微软助力AI应用开发

NVIDIA 在SIGGRAPH 2024 中曾向外界介绍了交互式数字人James。James将 NVIDIANIM 微服务、NVIDIAACE 和ElevenLabs 数字人技术相结合，可提供自然的沉浸式交互体验。

提升数字人交互的真实感，需要能够感知和理解周围环境更细微差别的技术。为此，NVIDIA开发了多模态小语言模型，可同时处理文本和图像信息，在角色扮演方面表现出色，并针对响应速度进行了优化。

再放大招！NVIDIA联手微软助力AI应用开发

NVIDIA 即将推出的Nemovision-4B-Instruct 模型利用最新的NVIDIA VILA 和NVIDIA NeMo 框架进行蒸馏、剪枝和量化，使其体积小到足以在RTX GPU上以开发者所需的精度运行。该模型使数字人能够理解现实世界和屏幕上的视觉图像，以做出相关的响应。多模态作为智能体工作流的基础，让我们得以窥见未来，届时数字人只需极少的用户辅助，即可进行推理并采取行动。

NVIDIA 还推出了Mistral NeMo Minitron 128k Instruct系列模型，这是一套专为优化的高效数字人交互而设计的长上下文小语言模型。这一系列模型提供8B、4B和 2B参数版本的灵活选项，以平衡在RTX AI PC上运行的速度、显存用量和模型精度。模型单次推理可以处理大量数据，无需进行数据分割和重组。这些模型提供GGUF 格式，为低功耗设备的效率进行优化，并与多种编程语言兼容。

利用面向Windows 的NVIDIA TensorRT Model Optimizer 加速生成式AI

将模型引入PC 环境时，开发者面临着有限的显存和计算资源，这为本地运行AI 提出了挑战。开发者希望模型可以被更多人使用，同时精度损失最小。

再放大招！NVIDIA联手微软助力AI应用开发

Microsoft Ignite大会上，NVIDIA公布了NVIDIA TensorRT Model Optimizer (ModelOpt) 的更新，为Windows 开发者提供了针对ONNX Runtime 部署的模型优化方案。借助最新更新，TensorRTModelOpt 可将模型优化为ONNX 格式，以便使用CUDA、TensorRT和 DirectML等 GPU运行后端在ONNX 运行时环境中部署模型。

最新更新使模型可优化为ONNX 检查点，以便通过CUDA、TensorRT和 DirectML等执行提供商在ONNX 运行时环境中部署模型，从而提高整个PC 生态系统的精度和吞吐量。在部署时，与FP16 模型相比，这些模型可将显存占用减少2.6 倍。这可提高吞吐量，同时精度损失降到最低，使其能够在更多的PC 上运行。

RTX AI PC 赋能AI 应用开发者

生成式AI 赋能的PC 正在推动游戏、内容创作、生产力和程序开发更进一步。目前，超过600 款Windows 应用和游戏已在全球超过1 亿台GeForce RTX AI PC 上本地运行AI，提供快速、可靠的低延迟体验。

再放大招！NVIDIA联手微软助力AI应用开发