NVIDIA 发布了 NVLM 1.0,这是一个重大举措,这是一款旨在与 OpenAI 等市场领导者竞争的尖端人工智能模型。该开源模型可供开发人员使用,它提供了一种多模式方法,可以彻底改变当前的人工智能生态系统。
NVLM 1.0模型拥有720 亿个参数,有望成为GPT-4的主要竞争对手之一,尤其是为 ChatGPT 提供支持的 GPT-4。该人工智能模型不仅能够在视觉和语言任务中表现出色,而且还通过多模式训练提高了其在文本任务上的性能。虽然一些模型在经过这样的训练后会表现出弱点,但NVIDIA成功保持甚至提高了 NVLM 的准确性,尤其是在与数学和编码相关的复杂基准测试上。
NVLM 的真正与众不同之处在于它能够通过针对 OCR (光学字符识别)和视觉 白俄罗斯电报数据 推理任务优化的处理来理解图像、图形甚至模因。因此,它在关键基准测试中表现优于或与Claude 3.5 Sonnet或Gemini 1.5 Pro等型号相当。这表明 NVLM 是 AI 领域的主要参与者,同时通过其开源模型更容易被访问。
为什么要与 OpenAI 竞争?
OpenAI凭借 GPT-4 等专有模型在人工智能领域占据主导地位,这促使其他参与者(Meta、谷歌、微软)做出反应。不过, NVIDIA的举措并不单单只是出于市场份额的考虑。通过将其模型开源,NVIDIA 希望迫使其他公司也效仿这一举措,提高透明度和可访问性。
除了竞争方面之外,这一开放决定还允许小公司获得尖端技术,而无需在研发上投入数百万美元。这鼓励了大规模创新,但也带来了监管挑战。如今,如此强大的人工智能已可供所有人使用,风险和滥用管理正成为一个主要问题。欧盟已经率先出台了类似《人工智能法案》的严格监管规定,其他地区也需要迅速效仿。
NVLM 1.0的推出表明AI竞赛远未结束。虽然OpenAI是先驱者,但 NVIDIA 专注于开源和高级多模式 AI 的战略很可能在未来几年改变游戏规则。
如果您喜欢这篇文章,并且正在考虑从事数据科学职业或只是想提高您所在领域的技能,请不要犹豫,了解我们的培训优惠或有关 DataScientest 的博客文章。
资料来源:research.nvidia.com