全部
多模态
文本
图片
视频
语音
推理模型
排序模型
向量模型
行业模型
其他
全部
<=8k
<=32k
<=64k
<=128k
>128k
全部
DeepSeek
GPT
Llama
通义千问
GLM
通义千问-Coder-Plus
文本生成
131K

通义千问系列代码及编程模型是专门用于编程和代码生成的语言模型,性能出色,效果突出。

通义千问-Coder-Plus-2024-11-06
文本生成
131K

通义千问系列代码及编程模型是专门用于编程和代码生成的语言模型,性能出色,效果突出,本模型是2024年11月6日快照版本,模型更新不会提前通知,预计维护到下个版本发布后一个月(待定)。

通义千问-Coder-Plus-Latest
文本生成
131K

通义千问系列代码及编程模型是专门用于编程和代码生成的语言模型,性能出色,效果突出,本模型是动态更新版本,模型更新不会提前通知,预计维护到下个版本发布后一个月(待定)。

Paraformer语音识别-8k-v2
语音识别

Paraformer最新中文语音识别模型,模型结构升级,具有更好的识别效果,支持8kHz电话语音识别,仅支持中文热词。

通义万相-文生图2.0-Turbo
图片生成

通义万相-文生图2.0-Turbo,更擅长质感人像和创意设计画作生成,在图像美观度、真实感、艺术性上全面升级,支持最大200万像素生成,支持智能提示词改写等。

通义万相-通用图像编辑
图片处理

通义万相-通义图像编辑,支持预设编辑任务与指令式编辑,包含多种局部/全图编辑能力,如图像风格化、线稿生图、局部重绘、参考图生成、图像外扩、图像超分等。

实时语音识别及翻译V1.0
语音识别

多语言语音转写及翻译的多模态大模型。本模型提供长时间、高准确率、实时转写中/英/日/韩等10个混合语种的服务。同时支持中英日韩互译,以其他6个语种翻译成中文或英文。

人像风格重绘
图片处理

人像风格重绘可以将输入的人物图像进行多种风格化的重绘生成,使新生成的图像在兼顾原始人物相貌的同时,带来不同风格的绘画效果。

图像背景生成
图片生成

图像背景生成可以基于输入的前景图像素材拓展生成背景信息,实现自然的光影融合效果,与细腻的写实画面生成。支持文本描述、图像引导等多种方式,同时支持对生成的图像智能添加文字内容。

FaceChain人物图像检测
图片生成

对用户上传的人物图像进行检测,判断其中所包含的人脸是否符合facechain微调所需的标准,检测维度包括人脸数量、大小、角度、光照、清晰度等多维度,支持图像组输入,并返回每张图像对应的检测结果。

FaceChain人物写真生成
图片生成

基于人物形象训练已经得到的形象,可以继续通过人物生成写真模型完成该形象的写真生成,支持多种预设风格,包括证件照、商务写真等。

FaceChain人物形象训练
图片生成

对上传的图像进行模型训练,从而获得该图像中对应人物的resource,基于该resource可以实现人物的写真生成。

WordArt锦书-文字纹理生成
图片生成

WordArt锦书-文字纹理生成可以对输入的文字内容或文字图片进行创意设计,根据提示词内容对文字添加材质和纹理,实现立体凸显或场景融合的效果,生成效果精美、风格多样的艺术字,结合背景可以直接作为文字海报使用。

WordArt锦书-文字变形
图片生成

WordArt锦书-文字变形可以对输入的文字边缘轮廓进行创意变形,根据提示词内容进行边缘变化,实现一种字体的更多种创意用法,返回带有文字内容的黑底白色mask图。

StableDiffusion文生图模型-xl
图片生成

stable-diffusion-xl相比于v1.5做了重大的改进,并且与当前为开源的文生图SOTA模型(midjorney)效果相当,具体改进之处包括: 更大的unet backbone,是之前的3倍; 增加了refinement模块用于改善生成图片的质量;更高效的训练技巧等。

人工导购
咨询服务