全部
多模态
文本
图片
视频
语音
推理模型
排序模型
向量模型
行业模型
其他
全部
<=8k
<=32k
<=64k
<=128k
>128k
全部
DeepSeek
GPT
Llama
通义千问
GLM
EnergyTS 2.0
行业大模型
时序模型

EnergyTS 2.0是蚂蚁数科推出的能源电力时序大模型,专为新能源行业定制。该模型采用混合专家(MoE)架构,融合气象、地理、日历等多元协变量信息,显著提升光伏发电、风力发电及用电负荷预测的精准度。参数规模从1B扩展至7B,能够应对更为复杂的能源预测任务。

Sora 2
视频生成
多模态

Sora 2是OpenAI推出的一款先进的视频生成模型,也称为“视频生成器”。它能够生成最长10秒的视频,支持滑动浏览,并配备身份验证功能,用户可以在视频中使用自己的形象。Sora 2在物理逻辑、画面一致性和真实感上都有显著提升,能够通过一张照片和一句提示词生成有剧情、有文案的短片。

Kimi K2 0905
文本生成
推理模型
250K

Kimi K2 0905是月之暗面科技有限公司推出的一款混合专家架构(MoE)的开源基础模型,总参数为1000亿,激活参数为32亿。该模型在编程能力、上下文长度和API性能方面进行了显著升级,特别适用于复杂的编程任务和软件开发。

Gemini-2.5 Computer Use (Preview)
多模态
行业大模型
128K

Gemini 2.5 Computer Use 模型是 Google 基于 Gemini 2.5 Pro 的视觉理解和推理能力构建的专用模型,专门用于控制用户界面。与传统通过结构化 API 进行软件交互不同,该模型可以像人类一样直接与图形用户界面交互。

GPT Image 1-mini
多模态
图片生成

GPT Image 1-mini 是 OpenAI 推出的一个原生多模态语言模型,能够同时接受文本和图像输入,并生成图像输出。该模型旨在提供高效且低成本的图像处理解决方案,适用于多种应用场景。

DeepSeek-V3.2-Exp
文本生成
推理模型
16K

DeepSeek-V3.2-Exp模型是DeepSeek发布的一个实验性版本,作为迈向下一代架构的重要中间步骤。该版本在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention稀疏注意力机制,针对长文本的训练和推理效率进行了探索性的优化和验证。

GLM-4.6
文本生成
推理模型

GLM-4.6 是智谱推出的最新大模型,在中文指令遵循率、代码一次性可运行率等方面表现优异,尤其在2024高考数学卷中展现了强大的推理能力。

紫东太初4.0
多模态
推理模型

紫东太初4.0多模态推理大模型由中国科学院自动化研究所联合武汉人工智能研究院研发,具备类人多模态推理认知能力,实现了从“纯文本思考”到“边看、边识、边思”的跃迁。

通义千问-Coder-Plus
文本生成
131K

通义千问系列代码及编程模型是专门用于编程和代码生成的语言模型,性能出色,效果突出。

通义千问-Coder-Plus-2024-11-06
文本生成
131K

通义千问系列代码及编程模型是专门用于编程和代码生成的语言模型,性能出色,效果突出,本模型是2024年11月6日快照版本,模型更新不会提前通知,预计维护到下个版本发布后一个月(待定)。

通义千问-Coder-Plus-Latest
文本生成
131K

通义千问系列代码及编程模型是专门用于编程和代码生成的语言模型,性能出色,效果突出,本模型是动态更新版本,模型更新不会提前通知,预计维护到下个版本发布后一个月(待定)。

Paraformer语音识别-8k-v2
语音识别

Paraformer最新中文语音识别模型,模型结构升级,具有更好的识别效果,支持8kHz电话语音识别,仅支持中文热词。

通义万相-文生图2.0-Turbo
图片生成

通义万相-文生图2.0-Turbo,更擅长质感人像和创意设计画作生成,在图像美观度、真实感、艺术性上全面升级,支持最大200万像素生成,支持智能提示词改写等。

通义万相-通用图像编辑
图片处理

通义万相-通义图像编辑,支持预设编辑任务与指令式编辑,包含多种局部/全图编辑能力,如图像风格化、线稿生图、局部重绘、参考图生成、图像外扩、图像超分等。

实时语音识别及翻译V1.0
语音识别

多语言语音转写及翻译的多模态大模型。本模型提供长时间、高准确率、实时转写中/英/日/韩等10个混合语种的服务。同时支持中英日韩互译,以其他6个语种翻译成中文或英文。

人工导购
咨询服务