全部
多模态
文本
图片
视频
语音
推理模型
排序模型
向量模型
行业模型
其他
全部
<=8k
<=32k
<=64k
<=128k
>128k
全部
DeepSeek
GPT
Llama
通义千问
GLM
ERNIE-4.0-8K-Latest
多模态
16K

百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效。

ERNIE-4.0-8K
多模态
16K

百度自研的旗舰级超大规模⼤语⾔模型,相较ERNIE 3.5实现了模型能力全面升级,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效。

ERNIE-4.0-Turbo-8K
多模态
16K

百度自研的旗舰级超大规模⼤语⾔模型,综合效果表现出色,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效。相较于ERNIE 4.0在性能表现上更优秀。

ERNIE-4.0-Turbo-8K-Preview
多模态
16K

百度自研的旗舰级超大规模⼤语⾔模型,综合效果表现出色,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效。相较于ERNIE 4.0在性能表现上更优秀。

ERNIE-4.0-Turbo-8K-0628
多模态
16K

百度自研的旗舰级超大规模⼤语⾔模型,综合效果表现出色,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效。相较于ERNIE 4.0在性能表现上更优秀。

ERNIE-4.0-Turbo-8K-Latest
多模态
16K

百度自研的旗舰级超大规模⼤语⾔模型,综合效果表现出色,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效。相较于ERNIE 4.0在性能表现上更优秀。

ERNIE-4.0-Turbo-128K
多模态
16K

百度自研的旗舰级超大规模⼤语⾔模型,综合效果表现出色,广泛适用于各领域复杂任务场景;支持自动对接百度搜索插件,保障问答信息时效。相较于ERNIE 4.0在性能表现上更优秀。

FLUX.1-schnell
文本生成

具有120亿参数的修正流变换器,能够根据文本描述生成图像。

ERNIE-iRAG-1.0
文本生成

百度自研的iRAG(image based RAG),检索增强的文生图技术,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了AI味儿,而且成本很低。iRAG具备无幻觉、超真实、立等可取等特点。

ERNIE-iRAG-Edit-1.0
文本生成

百度自研的ERNIE iRAG Edit图像编辑模型支持基于图片进行erase(消除对象)、repaint(重绘对象)、variation(生成变体)等操作。

流式语音合成
文档大模型

支持文本、语音双向流式,输入文本同时就可以近乎同步听到合成的语音。适用于基于大模型的语音助手、实时对话场景。

大模型语音合成
文档大模型

百度大模型语音合成基于新一代大模型能力,音色具备更高的自然度、丰富的情感表达等特点。并且模型能够根据上下文智能预测文本的情绪、语调等信息,自动匹配合适的情感表达。

大模型声音复刻
文档大模型

基于大模型zero-shot技术,模型能够捕捉到音色、韵律、情感等声音特征,从而实现高保真度的声音复刻。您只需录制5秒音频,即可极速复刻音色。广泛应用于配音、数字人、情感陪伴、语音助手等场景。

端到端语音语言大模型
文档大模型

基于业内首创的Cross-Attention跨模态语音大模型,可以进行快速问答。

大模型合同审查
其他

依托大模型能力,全面覆盖买卖、租赁、劳动等20+高频合同场景审查,精准定位合同风险点,提供合规建议、修订批注等风控支持,合同平均审核时效提升60%,显著加速合同全流程处理,有效保障企业合同法律合规性。

人工导购
咨询服务