通义千问VL-Max-2024-08-09

图片理解

音频理解

33K

版本名称：	通义千问VL-Max-2024-08-09
所属模型：	通义千问
所属公司：	阿里云
发布时间：	2024年8月26日
最新版本：	SNAPSHOT

参数规模：	未知
上下文长度：	33792
支持语言：	未知
授权协议：	未知
体验方式：	暂无

通义千问VL-Max-0809（qwen-vl-max-0809），即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力，支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能，本次更新上下文支持32k，增强图像理解和视觉推理能力，可以更好地识别图片中的多语言文字和手写体的文字，并集成视觉agent能力，本模型为2024年8月9日的快照版本，期维护到下个快照版本发布时间（待定）后一个月。

17

热度

StableDiffusion文生图模型-3.5-large 通义千问VL-OCR-2024-10-28 AI试衣-基础版 StableDiffusion文生图模型-3.5-large-turbo 一句话识别及翻译V1.0 通义千问-QVQ-Plus-Latest Sambert语音合成-知悦通义千问-QVQ-Max-2025-05-15 通义千问VL-Max-Latest 通义万相2.2-文生图-Flash

企业数字化服务平台

www.QiShuCang.com

微信

小红书

企数仓，企业数字化服务平台

津ICP备14003781号-3

回顶部

简介

应用

相关模型

关于我们

内容服务

产品服务

联系我们

人工导购

咨询服务