Gemma 是 Google 开发的一系列轻量级、尖端的开源文本生成模型,采用与 Gemini 模型相同的技术构建,适合用于各种文本生成任务,能够在资源量较小的端侧设备部署。
Fuyu-8B是由Adept AI训练的多模态图像理解模型,可以支持任意的图像分辨率,回答图形图表有关问题。模型在视觉问答和图像描述等任务上表现良好。
这是一个先进的多模态大型语言模型(MLLM)系列,展示了卓越的整体性能。
InternLM-XComposer2 是基于 InternLM2 的视觉-语言大模型 (VLLM),用于高级文本-图像理解和合成。
DeepSeek-VL2是一个先进的大型混合专家(MoE)视觉语言模型系列,显著提升了其前身DeepSeek-VL的性能。
业内知名的跨模态大模型,由Stability AI研发并开源,有着业内领先的图像生成能力。[了解更多>](https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0)
学而思九章大模型(MathGPT)是好未来自主研发的,以解题和讲题算法为核心的大模型。它具备四大核心功能:数学学科的自动解题、复杂应用题的批改、语文英语的作文批改以及个性化的AI分步骤讲题。
MiniMax图生视频系列是基于先进的人工智能技术开发的视频生成模型。
MiniMax-T2V-01是MiniMax公司推出的一款导演级视频生成模型。该模型以其精准遵循创作灵感、呈现电影般叙事节奏的能力而著称。
关注公众号
立刻获取最新消息及人工咨询