全部
多模态
文本
图片
视频
语音
推理模型
排序模型
向量模型
行业模型
其他
全部
<=8k
<=32k
<=64k
<=128k
>128k
全部
DeepSeek
GPT
Llama
通义千问
GLM
虚拟模特
图片生成

虚拟模特可以对上传的真人或者人台实拍商品展示图进行智能生成,将其中的模特和背景替换为心仪的内容,在保持人物姿态不变的情况下,使用虚拟模特对商品进行更加精美、多样的展示。支持各种与模特产生互动的商品,如手持小商品、服装、鞋靴、配饰等。

MiniMax abab6.5s-245k
文本生成
246K

abab6.5s 是MiniMax推出的万亿参数大语言模型,性价比极高,适用于通用场景,特别是在生产力复杂任务场景上表现较好,最大支持245k上下文窗口,支持搜索、function call等功能。

MiniMax abab6.5t-8k
文本生成
8K

abab6.5t是MiniMax推出的大语言模型,适用于中文人设对话场景,在人设保持、指令遵从、意图理解、生成趣味上会有比较好的效果。

MiniMax abab6.5g-8k
文本生成
8K

abab6.5g是MiniMax推出的大语言模型,适用于英文人设对话场景,在英文语言支持、人设保持、指令遵从、生成趣味上会有比较好的效果。

AI试衣OutfitAnyone-图片精修
图片处理

图片精修是对AI试衣生成的效果图进行二次生成,输出还原度更高的精修试衣效果图。

人物实例分割
图片生成

人物实例分割运用了检测和分割技术,不仅能够在图像中识别出不同的对象,而且还能准确地画出每一个对象边界的像素级掩码(mask)。

图像擦除补全
图片生成

图像擦除补全通过指定图像mask中要删除的人体、宠物、物品、文字、水印等图像区域,在保留背景的同时移除图像中的一个或多个人物、物体、文字等元素,此功能不支持输入prompt的消除。擦除补全技术结合了计算机视觉、AIGC inpainting等先进技术,可以在多种场景下应用,从而满足用户对隐私保护、内容创作和图像编辑等方面需求。

FLUX-merged
图片生成

FLUX.1-merged模型结合了"DEV"在开发阶段探索的深度特性和"Schnell"所代表的高速执行优势。通过这一举措,FLUX.1-merged不仅提升了模型的性能界限,还拓宽了其应用范围。

Paraformer实时语音识别-v2
语音识别

推荐使用 Paraformer最新实时语音识别模型,支持多个语种自由切换的视频直播、会议等实时场景的语音识别。可以通过language_hints参数选择语种获得更准确的识别效果。支持任意采样率。 支持的语言包括:中文(含粤语等各种方言)、英文、日语、韩语。 可支持热词。

Paraformer语音识别-v2
语音识别

推荐使用 Paraformer最新语音识别模型,支持多个语种的语音识别。可以通过language_hints参数选择语种获得更准确的识别效果,支持任意采样率。 支持的语言包括:中文(含粤语等各种方言)、英文、日语、韩语。可支持热词。

StableDiffusion文生图模型-3.5-large
图片生成

stable-diffusion-3.5-large是一个具有8亿参数的多模态扩散变压器(MMDiT)文本到图像生成模型,具备卓越的图像质量和提示词匹配度,支持生成100万像素的高分辨率图像,且能够在普通消费级硬件上高效运行。

StableDiffusion文生图模型-3.5-large-turbo
图片生成

stable-diffusion-3.5-large-turbo是在stable-diffusion-3.5-large的基础上采用对抗性扩散蒸馏(ADD)技术的模型,具备更快的速度。

通用文本向量-v1
向量模型

通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据。

通用文本向量-v2
向量模型

通用文本向量,是通义实验室基于LLM底座的多语言文本统一向量模型,面向全球多个主流语种,提供高水准的向量服务,帮助开发者将文本数据快速转换为高质量的向量数据。

通用文本向量-async-v1
向量模型

通用文本向量的批处理接口,通过这个接口客户可以以文本方式一次性的提交大批量的向量计算请求,在系统完成所有的计算之后,大模型服务平台会将结果信息存储在结果文件中供客户下载解析。

人工导购
咨询服务