杭州的程序员们赢麻了。
3月28日,全球最大AI开源社区HuggingFace发布的最新趋势榜单,排在前三的分别是DeepSeek-V3-0324、群核SpatialLM,以及通义千问Qwen2.5-Omni-7B,全部来自杭州,领先于英伟达、谷歌等公司模型。
此前有网友戏称:在开源大模型领域,杭州正在“挑战”杭州。现在,杭州成了全球范围内少有的,同时拥有三个世界顶级开源模型的城市。
老手稳定发挥
新力量迅速崛起
排名第一和第三的开源大模型大家比较眼熟,分别来自深度求索和阿里巴巴。
排第一位的DeepSeek-V3-0324,是3月26日凌晨由DeepSeek将此前热门的基座模型DeepSeek-V3进行全新小版本迭代而来。
DeepSeek-V3-0324在推理能力、代码生成、中文写作、搜索能力等方面都实现了显著提升。根据官方报告,它不仅全面超越Claude-3.7-Sonnet和与Qwen-Max等同类型优质模型,在数学、代码类等相关评测集上胜过GPT-4.5。经过这些天的测试,有人发现,它的代码能力甚至已经超过了DeepSeek-R1。
新版V3模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升
仅仅24小时后,阿里开源了首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可以同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。
Qwen2.5-Omni-7B可以接近人类的多感官方式“立体”认知世界并与之实时交互。你可以像打电话或视频通话一样与Qwen聊天,他甚至还能识别音视频中人物情绪。在复杂任务中进行更智能、更自然的反馈与决策。
在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni-7B刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。从开源到登上榜单前三,只用了一天时间。
相比排在第一位的DeepSeek和第三位的Qwen,SpatialLM是个新兵蛋子。
SpatialLM来自因为“杭州六小龙”火出圈的群核科技。虽然在大模型领域资历是个新手,不过从发布、开源到登上榜单第二,也只用了不到10天的时间。
SpatialLM最早亮相于3月20日的英伟达GTC2025大会上,是群核科技自主研发的空间理解模型,能让AI更好地认识真实的三维世界。
SpatialLM 基于视频重建的3D结构化场景
比如,给SpatialLM“刷”一段视频,它就能生成物理正确的3D场景布景,像人类环顾四周环境就能理解背后的空间结构一样,能够基于从视频中提取的点云数据,准确认知和理解其中的结构化场景信息,并将它以脚本语言的形式呈现出来。
它的意义在于,突破了大语言模型对物理世界几何与空间关系的理解局限,让机器具备空间认知与推理能力,可以为时下火热的具身智能提供训练的虚拟空间。
SpatialLM运行原理
相互追赶也相互成就
在全球大模型圈,杭州一直是你追我赶的优等生一样的存在。
今年1月至今,DeepSeek发布并开源了两款大模型,分别火到全球的DeepSeek-R1,以及DeepSeek-V3更新而来的0324版本。很多网友开始在线催更V4和R2。
大厂出身的通义千的更新速度到了令海外开发者震惊的程度。1月至今,已经发布并开源了7款大模型。为了照顾海外的开发者,无一例外地,发布时间都选择了凌晨。
Qwen2.5-max上线时,有海外网友惊呼:一天一个模型,太疯狂了……
全球知名AI平台HuggingFace的工程师王铁震就曾发文:Qwen霸屏了HuggingFace开源大模型榜单前十。
实际上,阿里云是国内最早也是唯一开源自研大模型的大厂,也是全球唯一一家积极研发先进AI模型并且全方位开源的云计算厂商。
自2023年8月以来,通义累计推出数十款不同类型的大模型,囊括大语言模型、多模态模型、数学模型和代码模型,多次登顶HuggingFace的Open LLM Leaderboard、司南OpenCompass等多个国内外权威大模型榜单,并多次冲上HuggingFace、Github的trending趋势榜单。
目前,海内外开源社区中Qwen的衍生模型数量已突破9万,超越了Meta(原Facebook公司)的Llama系列衍生模型,是目前世界最大的生成式语言模型族群。
不过,杭州的大模型圈虽然很卷,但互相追逐、一起探索前沿技术的同时,其实也是相互成就的过程。
DeepSeek官方曾透露,为了证明R1强大的推理能力可以快速移植到更小尺寸的模型上,将DeepSeek-R1的推理能力蒸馏给6个开源模型生成新模型。其中,4个模型就来自Qwen。基于Qwen-32B蒸馏的模型,在多项能力上实现了对标o1-mini的效果。
也正是因为DeepSeek的出圈,阿里巴巴在开源大模型领域的努力和沉淀,才被更多的人关注到。
这何尝不是一种相互成就。
声明:
本文仅代表作者个人观点,与江南网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
阅读推荐
新闻爆料