Shortcuts

支持的模型

TurboMind 支持的模型

模型 模型规模 FP16/BF16 KV INT8 W4A16
Llama 7B - 65B Yes Yes Yes
Llama2 7B - 70B Yes Yes Yes
InternLM 7B - 20B Yes Yes Yes
InternLM2 7B - 20B Yes - Yes
InternLM-XComposer 7B Yes Yes Yes
QWen 7B - 72B Yes Yes Yes
QWen-VL 7B Yes Yes Yes
Baichuan 7B Yes Yes Yes
Baichuan2 7B Yes Yes Yes
Code Llama 7B - 34B Yes No No

PyTorch 支持的模型

模型 模型规模 FP16/BF16 KV INT8 W8A8
Llama 7B - 65B Yes No Yes
Llama2 7B - 70B Yes No Yes
InternLM 7B - 20B Yes No Yes
InternLM2 7B - 20B Yes No -
Baichuan2 7B - 13B Yes No Yes
ChatGLM2 6B Yes No No
Falcon 7B - 180B Yes No No