stable-diffusion-v1.5是用stable-diffusion-v1.2 检查点的权重初始化的,并随后在 "laion-aesthetics v2 5+" 上以 512x512 的分辨率进行了595k步的微调,并减少了10%的文本条件化,以提高无分类器的引导采样。
Paraformer多语言语音识别模型,支持16kHz及以上采样率的音频或视频语音识别。 支持的语种/方言包括:中文普通话、中文方言(粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话)、英语、日语、韩语、西班牙语、印尼语、法语、德语、意大利语、马来语。
关注公众号
立刻获取最新消息及人工咨询