通义千问VL-Max-2024-08-09
图片理解
音频理解
33K
版本名称:通义千问VL-Max-2024-08-09
所属模型:通义千问
所属公司:阿里云
发布时间:2024年8月26日
最新版本:SNAPSHOT
参数规模:未知
上下文长度:33792
支持语言:未知
授权协议:未知
体验方式:暂无

简介

通义千问VL-Max-0809(qwen-vl-max-0809),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能,本次更新上下文支持32k,增强图像理解和视觉推理能力,可以更好地识别图片中的多语言文字和手写体的文字,并集成视觉agent能力,本模型为2024年8月9日的快照版本,期维护到下个快照版本发布时间(待定)后一个月。

应用

17
热度
人工导购
咨询服务