对用户上传的人物图像进行检测,判断其中所包含的人脸是否符合facechain微调所需的标准,检测维度包括人脸数量、大小、角度、光照、清晰度等多维度,支持图像组输入,并返回每张图像对应的检测结果。
WordArt锦书-文字纹理生成可以对输入的文字内容或文字图片进行创意设计,根据提示词内容对文字添加材质和纹理,实现立体凸显或场景融合的效果,生成效果精美、风格多样的艺术字,结合背景可以直接作为文字海报使用。
stable-diffusion-xl相比于v1.5做了重大的改进,并且与当前为开源的文生图SOTA模型(midjorney)效果相当,具体改进之处包括: 更大的unet backbone,是之前的3倍; 增加了refinement模块用于改善生成图片的质量;更高效的训练技巧等。
stable-diffusion-v1.5是用stable-diffusion-v1.2 检查点的权重初始化的,并随后在 "laion-aesthetics v2 5+" 上以 512x512 的分辨率进行了595k步的微调,并减少了10%的文本条件化,以提高无分类器的引导采样。
Paraformer多语言语音识别模型,支持16kHz及以上采样率的音频或视频语音识别。 支持的语种/方言包括:中文普通话、中文方言(粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话)、英语、日语、韩语、西班牙语、印尼语、法语、德语、意大利语、马来语。
关注公众号
立刻获取最新消息及人工咨询