大模型列表 - 企数仓

热门搜索：数字员工数字孪生数字化转型

关注公众号

模型分类

全部

多模态

文本

图片

视频

语音

推理模型

排序模型

向量模型

行业模型

其他

上下文

全部

<=8k

<=32k

<=64k

<=128k

>128k

热门模型

全部

DeepSeek

GPT

Llama

通义千问

GLM

多模态

图片生成

视频生成

腾讯混元2.0是一款多模态大模型，专注于图像生成和游戏视觉内容生产。该模型在图像生成速度上实现了毫秒级响应，支持实时文生图和实时绘画板功能，大幅提升了创意表达和设计效率。混元2.0在游戏场景中表现出色，支持图生视频、自定义模型训练和角色一键精修等功能，适用于游戏资产生成和美术设计。

查看详情

行业大模型

豆蔻妇科大模型是由壹生检康（杭州）生命科技有限公司研发的垂直医疗模型，专注于妇产科领域。该模型通过国家妇产科卫生高级职称（正高）笔试考试，具备主任级医师的专业判断力。模型依托钉钉企业专属AI平台，通过高质量妇产科数据构建与多阶段优化训练方法实现性能跃升，诊断准确率达到90.2%。

查看详情

多模态

行业大模型

MiMo-Embodied是小米推出的业界首个成功打通自动驾驶与具身智能的跨域具身基座模型，实现了两大领域任务的统一建模，标志着通用具身智能研究从“垂直领域专用”向“跨域能力协同”迈出关键一步。该模型同步支持具身智能三大核心任务（可供性推理、任务规划、空间理解）与自动驾驶三大关键任务（环境感知、状态预测、驾驶规划），形成全场景智能支撑。

查看详情

多模态

推理模型

全模态

977K

Gemini 3 Pro是谷歌推出的最新一代AI模型，具备强大的推理、多模态理解和编程能力。它支持原生多模态输入，包括文本、图像、视频、音频和代码，能够在复杂任务中表现出色。Gemini 3 Pro在多个基准测试中表现优异，尤其是在推理、多模态和编程领域，被誉为当前最智能的AI模型之一。

查看详情

推理模型

文本生成

32K

VibeThinker-1.5B是新浪微博推出的开源大型语言模型，拥有15亿参数。该模型通过创新的“频谱到信号原理”（SSP）训练框架，在数学推理和代码生成任务中表现出色，甚至超越了参数量更大的模型。VibeThinker-1.5B的开源旨在为全球计算资源有限的中型企业及高校研究团队提供一条高性价比的研发新路径。

查看详情

多模态

具身智能

Pelican-VL 1.0 是北京人形机器人创新中心开源的一款具身智能 VLM 模型，覆盖 7B 和 72B 参数规模，是全球性能最强大的具身智能 VLM 模型之一。该模型通过 DPPO 训练范式，实现了在视觉-语言和具身任务上的卓越性能，支持零样本物体操作、触觉闭环抓握和多机器人协作等任务。

查看详情

推理模型

智能体

250K

Kimi K2 Thinking 是月之暗面发布的开源思考模型，具备边思考边使用工具的能力，无需用户干预，可自主实现300轮工具调用和多轮思考能力。在自主网络浏览能力、复杂信息收集推理等多项基准测试中达到领先水平。

查看详情

多模态

文本生成

图像理解

250K

Doubao-Seed-Code 是字节跳动推出的专为Agentic编程任务深度优化的编程模型，支持256K长上下文，能够处理长代码文件、多模块依赖等复杂场景，尤其在前端开发中表现突出。作为国内首个支持视觉理解能力的编程模型，它可参照UI设计稿、截图或手绘草图生成代码，或对生成页面进行视觉比对，自主完成样式修复和Bug修复，大幅提升前端开发效率。

查看详情

多模态

推理模型

256K

Doubao-Seed-1.6-thinking-0715 是字节跳动推出的深度思考模型，具备强大的逻辑推理和多模态理解能力。该模型在代码、数学、逻辑推理等基础能力上进一步提升，支持视觉理解，并支持256K长上下文窗口，输出长度最大支持16K tokens。

查看详情

文本生成

推理模型

16K

DeepSeek V3.2 是深度求索公司推出的最新实验性模型，引入了革命性的 DeepSeek Sparse Attention (DSA) 技术，显著提升了长文本处理的效率。该模型在 V3.1-Terminus 的基础上进行了优化，训练和推理效率提高了 30%-50%，同时 API 调用成本降低了超过 50%。

查看详情

文本生成

推理模型

196K

Claude Sonnet 4.5 is a state-of-the-art AI model developed by Anthropic, designed to excel in programming, reasoning, and complex task execution. It features a 200K context window, allowing it to handle large-scale projects and long-duration tasks efficiently. The model has demonstrated superior performance in various benchmarks, including SWE-bench Verified and OSWorld, making it a leading tool for developers and professionals in fields such as finance, law, and medicine.

查看详情