金博宝app手机版 阿里发布千问Qwen3.7-Max模子:国产最好,可全自主完成35小时长程任务

新浪科技讯 5月20日上昼音讯,阿里巴巴发布新一代千问旗舰模子Qwen3.7-Max,在三方机构Arena巨匠大模子盲测总榜中,Qwen3.7-Max越过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模子接近,位各国产模子第一。
据悉,千问3.7面向当下智能体(Agent)全新联想,齐备了编程、推理等中枢才调的握续冲破,甚而可全自主完成35小时的超长程智能体复杂任务:在一个全新的芯片平台上,Qwen3.7-Max通过自主编程和超1000次器用调用,齐备了一个要津内核的自我进化,推理速率较原版块进步10倍。
当下,编程才调已成为料到LLM大说话模子的中枢野心,亚搏中国手机版app下载Qwen3.7-Max较上代模子齐备了大幅进步,从前端原型耕种到复杂的多文献工程均能独霸。在评估AI贬责确切寰球的实战编程任务SWE-bench系列测评、面向确切科知识题的编程测评SciCode中,Qwen3.7-Max较Qwen3.6-Plus大幅进步,并卓绝了Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模子。千问3.7是出色的编程智能体,可自主编写代码创造器用,精真实行任务,金博宝app手机版完成复杂编程的自我纠错迭代,就像个资深工程师,跑完从需求分析到测试迭代的全进程,自主产出可用的工业级适度。
HJC黄金城官方首页入口不断进步的编程才调,也为智能体完成更复杂、更长周期的任务打下坚实基础。千问3.7具有极强的Agent才调,并显泄露跨多种智能体框架的泛化才调,在 Claude Code、OpenClaw、Qwen Code 等框架下齐能贯通进展,有望成为各种智能体系统的可靠底座。通过MCP集成和多智能体和谐,Qwen3.7-Max在企业级办公场景齐备责任流自动化,在办公自动化基准 SpreadSheetBench-v1上斩获87分,处于顶尖水平,是可靠的办公与出产力助手。以往需专科团队耗时一至两周的复杂技俩,现由 Qwen3.7-Max 驱动的智能体可在数小时内完成端到端拜托闭环。
实战任务测试中,Qwen3.7-Max还展示了当下智能体所能达到的长程任务极限。在一个模子测验时从未战斗过的全新硬件平台——平头哥真武M890芯片上,千问3.7自主完成了一个复杂的推理内核优化任务。在莫得任何性能分析数据、硬件文档或新架构的示例内核情况下,千问3.7仅从一个包含任务态状、SGLang Triton 参考齐备和评测剧本的空缺责任空间启程,从“零”开动握续编程 35 小时,孤独进行了 432 次内核评估、1158 次器用调用,十足自主地完成了编写、编译、性能分析与迭代创新的全进程。(文猛)
海量资讯、精确解读,尽在新浪财经APP
累赘剪辑:江钰涵 金博宝app手机版