全部
多模态
文本
图片
视频
语音
推理模型
排序模型
向量模型
行业模型
其他
全部
<=8k
<=32k
<=64k
<=128k
>128k
全部
DeepSeek
GPT
Llama
通义千问
GLM
Vidu-1.0
语音大模型

Vidu 1.0 是由生数科技自研的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。Vidu 1.0 能够在短时间内生成4秒或8秒的精美视频片段。其广泛应用于游戏设计、动画制作和创意内容生产等领域。

Vidu-Q1-Img2Video
语音大模型

Vidu 是由生数科技联合清华大学正式发布的中国首个长时长、高一致性、高动态性视频大模型。Vidu 在语义理解、推理速度、动态幅度等方面具备领先优势,并上线了全球首个“多主体参考”功能,突破视频模型一致性生成难题,开启了视觉上下文时代。

Vidu-Q1-StartEnd2Video
语音大模型

Vidu 是由生数科技联合清华大学正式发布的中国首个长时长、高一致性、高动态性视频大模型。Vidu 在语义理解、推理速度、动态幅度等方面具备领先优势,并上线了全球首个“多主体参考”功能,突破视频模型一致性生成难题,开启了视觉上下文时代。

Vidu-Q1-Text2Video
语音大模型

Vidu 是由生数科技联合清华大学正式发布的中国首个长时长、高一致性、高动态性视频大模型。Vidu 在语义理解、推理速度、动态幅度等方面具备领先优势,并上线了全球首个“多主体参考”功能,突破视频模型一致性生成难题,开启了视觉上下文时代。

Kling-1.6-Image2Video
语音大模型

Kling-1.6-Image2Video能够接收用户上传的静态图像,并根据用户的文本描述或指令,将这些图像转换成生动、流畅的视频。

Kling-1.6-Text2Video
语音大模型

可灵1.6版本在物理规律的呈现上有了显著提升。无论是刀具与食材的互动、切片的力度,还是日常场景中的倒茶、猫咪踩沙发、狗狗奔跑等动作,都展现出了更加真实的物理效果。

kling-2.0-image2video
语音大模型

‌可灵2.0是快手推出的最新一代视频生成模型,它在多个方面实现了显著提升,并在全球视频生成大模型榜单中名列前茅。

kling-2.0-text2video
语音大模型

‌可灵2.0是快手推出的最新一代视频生成模型,它在多个方面实现了显著提升,并在全球视频生成大模型榜单中名列前茅。

Wan-2.1-I2V-14B-720P
语音大模型

基于主流的扩散变压器范式设计,通过一系列创新实现了生成能力的重大进步。这些创新包括我们的新型时空变分自编码器(VAE)、可扩展的训练策略、大规模数据构建和自动化评估指标。这些贡献共同提升了模型的性能和多功能性。

Wan-2.1-StartEnd2Video-14B-720P
语音大模型

基于主流的扩散变压器范式设计,通过一系列创新实现了生成能力的重大进步。这些创新包括我们的新型时空变分自编码器(VAE)、可扩展的训练策略、大规模数据构建和自动化评估指标。这些贡献共同提升了模型的性能和多功能性。

Wan2.1-T2V-14B
语音大模型

基于主流的扩散变压器范式设计,通过一系列创新实现了生成能力的重大进步。这些创新包括我们的新型时空变分自编码器(VAE)、可扩展的训练策略、大规模数据构建和自动化评估指标。这些贡献共同提升了模型的性能和多功能性。

Qwen2.5-VL-7B-Instruct
行业大模型
16K

Qwen2.5-VL是阿里通义千问团队发布的旗舰视觉语言模型,在Qwen2-VL视觉-语言模型上做了更先进的改进

Qwen2.5-VL-32B-Instruct
行业大模型
16K

Qwen2.5-VL是阿里通义千问团队发布的旗舰视觉语言模型,在Qwen2-VL视觉-语言模型上做了更先进的改进

Qwen2-VL-2B-Instruct
行业大模型

Qwen2-VL系列模型是由阿里云千问团队开发的多模态大语言模型,该系列模型在视觉理解和内容生成领域取得了显著进展。

Qwen2-VL-7B-Instruct
行业大模型

Qwen2-VL系列模型是由阿里云千问团队开发的多模态大语言模型,该系列模型在视觉理解和内容生成领域取得了显著进展。

人工导购
咨询服务