全部
多模态
文本
图片
视频
语音
推理模型
排序模型
向量模型
行业模型
其他
全部
<=8k
<=32k
<=64k
<=128k
>128k
全部
DeepSeek
GPT
Llama
通义千问
GLM
混元 2.0
多模态
图片生成
视频生成

腾讯混元2.0是一款多模态大模型,专注于图像生成和游戏视觉内容生产。该模型在图像生成速度上实现了毫秒级响应,支持实时文生图和实时绘画板功能,大幅提升了创意表达和设计效率。混元2.0在游戏场景中表现出色,支持图生视频、自定义模型训练和角色一键精修等功能,适用于游戏资产生成和美术设计。

豆蔻大模型
行业大模型

豆蔻妇科大模型是由壹生检康(杭州)生命科技有限公司研发的垂直医疗模型,专注于妇产科领域。该模型通过国家妇产科卫生高级职称(正高)笔试考试,具备主任级医师的专业判断力。模型依托钉钉企业专属AI平台,通过高质量妇产科数据构建与多阶段优化训练方法实现性能跃升,诊断准确率达到90.2%。

MiMo-Embodied
多模态
行业大模型

MiMo-Embodied是小米推出的业界首个成功打通自动驾驶与具身智能的跨域具身基座模型,实现了两大领域任务的统一建模,标志着通用具身智能研究从“垂直领域专用”向“跨域能力协同”迈出关键一步。该模型同步支持具身智能三大核心任务(可供性推理、任务规划、空间理解)与自动驾驶三大关键任务(环境感知、状态预测、驾驶规划),形成全场景智能支撑。

Gemini 3 Pro
多模态
推理模型
全模态
977K

Gemini 3 Pro是谷歌推出的最新一代AI模型,具备强大的推理、多模态理解和编程能力。它支持原生多模态输入,包括文本、图像、视频、音频和代码,能够在复杂任务中表现出色。Gemini 3 Pro在多个基准测试中表现优异,尤其是在推理、多模态和编程领域,被誉为当前最智能的AI模型之一。

VibeThinker-1.5B
推理模型
文本生成
32K

VibeThinker-1.5B是新浪微博推出的开源大型语言模型,拥有15亿参数。该模型通过创新的“频谱到信号原理”(SSP)训练框架,在数学推理和代码生成任务中表现出色,甚至超越了参数量更大的模型。VibeThinker-1.5B的开源旨在为全球计算资源有限的中型企业及高校研究团队提供一条高性价比的研发新路径。

Pelican-VL 1.0
多模态
具身智能

Pelican-VL 1.0 是北京人形机器人创新中心开源的一款具身智能 VLM 模型,覆盖 7B 和 72B 参数规模,是全球性能最强大的具身智能 VLM 模型之一。该模型通过 DPPO 训练范式,实现了在视觉-语言和具身任务上的卓越性能,支持零样本物体操作、触觉闭环抓握和多机器人协作等任务。

Kimi-K2-Thinking
推理模型
智能体
250K

Kimi K2 Thinking 是月之暗面发布的开源思考模型,具备边思考边使用工具的能力,无需用户干预,可自主实现300轮工具调用和多轮思考能力。在自主网络浏览能力、复杂信息收集推理等多项基准测试中达到领先水平。

Doubao-Seed-Code 251028
多模态
文本生成
图像理解
250K

Doubao-Seed-Code 是字节跳动推出的专为Agentic编程任务深度优化的编程模型,支持256K长上下文,能够处理长代码文件、多模块依赖等复杂场景,尤其在前端开发中表现突出。作为国内首个支持视觉理解能力的编程模型,它可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和Bug修复,大幅提升前端开发效率。

Doubao-Seed-1.6-thinking-0715
多模态
推理模型
256K

Doubao-Seed-1.6-thinking-0715 是字节跳动推出的深度思考模型,具备强大的逻辑推理和多模态理解能力。该模型在代码、数学、逻辑推理等基础能力上进一步提升,支持视觉理解,并支持256K长上下文窗口,输出长度最大支持16K tokens。

DeepSeek V3.2(Think)
文本生成
推理模型
16K

DeepSeek V3.2 是深度求索公司推出的最新实验性模型,引入了革命性的 DeepSeek Sparse Attention (DSA) 技术,显著提升了长文本处理的效率。该模型在 V3.1-Terminus 的基础上进行了优化,训练和推理效率提高了 30%-50%,同时 API 调用成本降低了超过 50%。

Claude Sonnet 4.5
文本生成
推理模型
196K

Claude Sonnet 4.5 is a state-of-the-art AI model developed by Anthropic, designed to excel in programming, reasoning, and complex task execution. It features a 200K context window, allowing it to handle large-scale projects and long-duration tasks efficiently. The model has demonstrated superior performance in various benchmarks, including SWE-bench Verified and OSWorld, making it a leading tool for developers and professionals in fields such as finance, law, and medicine.

Gemini 2.5 Flash
图像生成
图像理解
多模态
32K

Gemini 2.5 Flash是谷歌推出的革命性AI图像生成与编辑模型,以其闪电般的处理速度和角色一致性保持能力著称。该模型在创意生成、响应效率与用户体验上表现出色,将AI图像生成工具从“有趣的玩具”推向了“实用的生产力工具”。

DeepSeek V3.1 Terminus
文本生成
推理模型
125K

DeepSeek V3.1 Terminus 是深度求索公司发布的最新版本,该版本在保持原有模型能力的基础上,针对用户反馈的问题进行了改进,特别是在语言一致性和Agent能力方面进行了优化。模型支持128k的上下文长度,并提供了思考模型和非思考模式两种版本,适用于多种复杂任务处理。

文心 5.0
多模态
全模态
文本生成
视频生成
音频理解
图像理解
16K

文心大模型5.0是百度发布的新一代原生全模态大模型,采用自回归统一架构,支持理解与生成一体化。该模型参数量达2.4万亿,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出。

Doubao-Seed-1.6
多模态
文本生成
推理模型
256K

Doubao-Seed-1.6 是字节跳动推出的全功能综合模型,支持256K长上下文、自适应思考、多模态理解和图形界面操作等多项能力。该模型能够理解和处理真实世界问题,具备强大的编码、数学和逻辑推理能力。

人工导购
咨询服务