NVLM：ChatGPT 的强劲竞争对手？

Bappy11 · Post by **Bappy11** » Sun Feb 09, 2025 6:59 am

NVIDIA 发布了 NVLM 1.0，这是一个重大举措，这是一款旨在与 OpenAI 等市场领导者竞争的尖端人工智能模型。该开源模型可供开发人员使用，它提供了一种多模式方法，可以彻底改变当前的人工智能生态系统。

NVLM 1.0模型拥有720 亿个参数，有望成为GPT-4的主要竞争对手之一，尤其是为 ChatGPT 提供支持的 GPT-4。该人工智能模型不仅能够在视觉和语言任务中表现出色，而且还通过多模式训练提高了其在文本任务上的性能。虽然一些模型在经过这样的训练后会表现出弱点，但NVIDIA成功保持甚至提高了 NVLM 的准确性，尤其是在与数学和编码相关的复杂基准测试上。

NVLM 的真正与众不同之处在于它能够通过针对 OCR （光学字符识别）和视觉白俄罗斯电报数据推理任务优化的处理来理解图像、图形甚至模因。因此，它在关键基准测试中表现优于或与Claude 3.5 Sonnet或Gemini 1.5 Pro等型号相当。这表明 NVLM 是 AI 领域的主要参与者，同时通过其开源模型更容易被访问。

为什么要与 OpenAI 竞争？
OpenAI凭借 GPT-4 等专有模型在人工智能领域占据主导地位，这促使其他参与者（Meta、谷歌、微软）做出反应。不过， NVIDIA的举措并不单单只是出于市场份额的考虑。通过将其模型开源，NVIDIA 希望迫使其他公司也效仿这一举措，提高透明度和可访问性。

除了竞争方面之外，这一开放决定还允许小公司获得尖端技术，而无需在研发上投入数百万美元。这鼓励了大规模创新，但也带来了监管挑战。如今，如此强大的人工智能已可供所有人使用，风险和滥用管理正成为一个主要问题。欧盟已经率先出台了类似《人工智能法案》的严格监管规定，其他地区也需要迅速效仿。

NVLM 1.0的推出表明AI竞赛远未结束。虽然OpenAI是先驱者，但 NVIDIA 专注于开源和高级多模式 AI 的战略很可能在未来几年改变游戏规则。

如果您喜欢这篇文章，并且正在考虑从事数据科学职业或只是想提高您所在领域的技能，请不要犹豫，了解我们的培训优惠或有关 DataScientest 的博客文章。

资料来源：research.nvidia.com