全部
多模态
文本
图片
视频
语音
推理模型
排序模型
向量模型
行业模型
其他
全部
<=8k
<=32k
<=64k
<=128k
>128k
全部
DeepSeek
GPT
Llama
通义千问
GLM
falcon-40b-instruct
多模态
16K

由TII研发的仅使用解码器的模型,并在Baize的混合数据集上进行微调,具备优异的推理效果。[了解更多>](https://huggingface.co/tiiuae/falcon-40b-instruct)

falcon-7b-v5-fp16
多模态
16K

由TII研发、在精选语料库增强的1500B tokens上进行训练。由OpenBuddy调优并开源,提升了处理复杂对话任务的能力与表现。[了解更多>](https://huggingface.co/OpenBuddy/openbuddy-falcon-7b-v5-fp16)

rwkv-4-pile-14b
多模态
16K

由香港大学物理系校友彭博研发并开源的14B参数模型,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。[了解更多>](https://huggingface.co/BlinkDL)

rwkv-raven-14b
多模态
16K

由香港大学物理系校友彭博研发并开源的14B参数模型,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。[了解更多>](https://huggingface.co/BlinkDL)

rwkv-4-world
多模态
16K

由香港大学物理系校友彭博研发并开源的7B参数模型,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。[了解更多>](https://huggingface.co/BlinkDL/rwkv-4-world)

BLOOMZ-7B
多模态

业内知名的⼤语⾔模型,由BigScience研发并开源,能够以46种语⾔和13种编程语⾔输出⽂本。[了解更多>](https://huggingface.co/bigscience/bloom)

Qianfan-BLOOMZ-7B-compressed
多模态

业内知名的⼤语⾔模型,由BigScience研发并开源,能够以46种语⾔和13种编程语⾔输出⽂本。[了解更多>](https://huggingface.co/bigscience/bloom)

DISC-MedLLM
视频生成
16K

DISC-MedLLM是一个专门针对医疗健康对话式场景而设计的医疗领域大模型,由[复旦大学数据智能与社会计算实验室 (Fudan-DISC)](http://fudan-disc.com/)开发并开源。[了解更多>](https://github.com/FudanDISC/DISC-MedLLM)

XuanYuan-70B-Chat-4bit
视频生成

由度小满开发,基于Llama2-70B模型进行中文增强的金融行业大模型,通用能力显著提升,在CMMLU/CEVAL等各项榜单中排名前列;金融域任务超越领先通用模型,支持金融知识问答、金融计算、金融分析等各项任务。[了解更多>](https://huggingface.co/Duxiaoman-DI/XuanYuan-70B-Chat-4bit)

starcoder
多模态
16K

由BigCode研发的15.5B参数模型,基于The Stack (v1.2)的80+编程语言训练,训练语料来自Github。[了解更多>](https://huggingface.co/bigcode/starcoder)

CodeLlama-7b-Instruct
多模态

Code Llama是由Meta AI研发并开源的一系列文本生成模型,旨在用于一般代码合成和理解。该模型参数规模为70亿。[了解更多>](https://huggingface.co/codellama/CodeLlama-7b-Instruct-hf)

sqlcoder-7b
多模态

由Defog研发、基于Mistral-7B微调的语言模型,用于将自然语言问题转换为SQL语句,具备优秀的生成效果。[了解更多>](https://huggingface.co/defog/sqlcoder-7b)

AquilaChat-7B
多模态
16K

由智源研究院研发的中英双语语言模型,继承了GPT-3和LLaMA的架构优点,基于中英文高质量语料训练,实现了高效训练,获得了比其他开源模型更优的性能,并符合国内数据合规需要。[了解更多>](https://huggingface.co/BAAI)

AquilaCode-multi
多模态
16K

由智源研究院研发的中英双语语言模型,继承了GPT-3和LLaMA的架构优点,基于中英文高质量语料训练,实现了高效训练,获得了比其他开源模型更优的性能,并符合国内数据合规需要。[了解更多>](https://huggingface.co/BAAI)

XVERSE-13B-Chat
多模态
16K

由深圳元象科技自主研发的支持多语言的大语言模型,支持8k上下文、40多种语言,具备训练效率高、稳定性强、算力利用率高等特点。[了解更多>](https://huggingface.co/xverse/XVERSE-13B-Chat)

人工导购
咨询服务