华为昇腾(Atlas 800T A2)#
我们基于 LMDeploy 的 PytorchEngine,增加了华为昇腾设备的支持。所以,在华为昇腾上使用 LDMeploy 的方法与在英伟达 GPU 上使用 PytorchEngine 后端的方法几乎相同。在阅读本教程之前,请先阅读原版的快速开始。
安装#
我们强烈建议用户构建一个 Docker 镜像以简化环境设置。
克隆 lmdeploy 的源代码,Dockerfile 位于 docker 目录中。
git clone https://github.com/InternLM/lmdeploy.git
cd lmdeploy
环境准备#
Docker 版本应不低于 18.03。并且需按照官方指南安装 Ascend Docker Runtime。
Drivers,Firmware 和 CANN#
目标机器需安装华为驱动程序和固件版本 23.0.3,请参考 CANN 驱动程序和固件安装 和下载资源。
另外,docker/Dockerfile_aarch64_ascend没有提供CANN 安装包,用户需要自己从昇腾资源下载中心下载CANN(8.0.RC3.alpha001)软件包。
并将Ascend-cann-kernels-910b*.run`` 和 Ascend-cann-toolkit*-aarch64.run`` 放在 lmdeploy 源码根目录下。
构建镜像#
请在 lmdeploy源 代码根目录下执行以下镜像构建命令,CANN 相关的安装包也放在此目录下。
DOCKER_BUILDKIT=1 docker build -t lmdeploy-aarch64-ascend:latest \
-f docker/Dockerfile_aarch64_ascend .
如果以下命令执行没有任何错误,这表明环境设置成功。
docker run -e ASCEND_VISIBLE_DEVICES=0 --rm --name lmdeploy -t lmdeploy-aarch64-ascend:latest lmdeploy check_env
关于在昇腾设备上运行docker run命令的详情,请参考这篇文档。
离线批处理#
LLM 推理#
将device_type="ascend"加入PytorchEngineConfig的参数中。
from lmdeploy import pipeline
from lmdeploy import PytorchEngineConfig
if __name__ == "__main__":
pipe = pipeline("internlm/internlm2_5-7b-chat",
backend_config = PytorchEngineConfig(tp=1, device_type="ascend"))
question = ["Shanghai is", "Please introduce China", "How are you?"]
response = pipe(question)
print(response)
VLM 推理#
将device_type="ascend"加入PytorchEngineConfig的参数中。
from lmdeploy import pipeline, PytorchEngineConfig
from lmdeploy.vl import load_image
if __name__ == "__main__":
pipe = pipeline('OpenGVLab/InternVL2-2B',
backend_config=PytorchEngineConfig(tp=1, device_type='ascend'))
image = load_image('https://raw.githubusercontent.com/open-mmlab/mmdeploy/main/tests/data/tiger.jpeg')
response = pipe(('describe this image', image))
print(response)
在线服务#
LLM 模型服务#
将--device ascend加入到服务启动命令中。
lmdeploy serve api_server --backend pytorch --device ascend internlm/internlm2_5-7b-chat
VLM 模型服务#
将--device ascend加入到服务启动命令中。
lmdeploy serve api_server --backend pytorch --device ascend OpenGVLab/InternVL2-2B
使用命令行与LLM模型对话#
将--device ascend加入到服务启动命令中。
lmdeploy chat internlm/internlm2_5-7b-chat --backend pytorch --device ascend
也可以运行以下命令使启动容器后开启lmdeploy聊天
docker exec -it lmdeploy_ascend_demo \
bash -i -c "lmdeploy chat --backend pytorch --device ascend internlm/internlm2_5-7b-chat"