快速上手¶
LMDeploy提供了快速安装、模型量化、离线批处理、在线推理服务等功能。每个功能只需简单的几行代码或者命令就可以完成。
离线批处理¶
import lmdeploy
pipe = lmdeploy.pipeline("internlm/internlm-chat-7b")
response = pipe(["Hi, pls intro yourself", "Shanghai is"])
print(response)
有关 pipeline 的详细使用说明,请参考这里
推理服务¶
LMDeploy api_server 支持把模型一键封装为服务,对外提供的 RESTful API 兼容 openai 的接口。以下为服务启动的示例:
lmdeploy serve api_server internlm/internlm-chat-7b
服务默认端口是23333。在 server 启动后,你可以在终端通过api_client与server进行对话:
lmdeploy serve api_client http://0.0.0.0:23333
除了api_client,你还可以通过 Swagger UI http://0.0.0.0:23333 在线阅读和试用 api_server 的各接口,也可直接查阅文档,了解各接口的定义和使用方法。