部署 Single Shot Multibox Detector(SSD)模型
本文介绍如何用 TVM 部署 SSD 模型。这里将使用 GluonCV 预训练的 SSD 模型,并将其转换为 Relay IR。
import tvm
from tvm import te
from matplotlib import pyplot as plt
from tvm import relay
from tvm.contrib import graph_executor
from tvm.contrib.download import download_testdata
from gluoncv import model_zoo, data, utils
现在支持在 CPU 和 GPU 上编译 SSD。
为取得 CPU 上的最佳推理性能,需要根据设备修改 target 参数——对于 x86 CPU:参考 为 x86 CPU 自动调整卷积网络 来调整;对于 arm CPU:参考 为 ARM CPU 自动调整卷积网络 来调整。
为在 Intel 显卡上取得最佳推理性能,将 target 参数修改为 opencl -device=intel_graphics
。注意:在 Mac 上使用 Intel 显卡时,target 要设置为 opencl
,因为 Mac 上不支持 Intel 子组扩展。
为取得基于 CUDA 的 GPU 上的最佳推理性能,将 target 参数修改为 cuda
;对于基于 OPENCL 的 GPU,将 target 参数修改为 opencl
supported_model = [
"ssd_300_vgg16_atrous_voc" "ssd_512_vgg16_atrous_coco",
model_name = supported_model[0]
dshape = (1, 3, 512, 512)
下载并预处理 demo 图像:
im_fname = download_testdata(
"https://github.com/dmlc/web-data/blob/main/" + "gluoncv/detection/street_small.jpg?raw=true",
x, img = data.transforms.presets.ssd.load_test(im_fname, short=512)
为 CPU 转换和编译模型:
block = model_zoo.get_model(model_name, pretrained=True)
def build(target):
mod, params = relay.frontend.from_mxnet(block, {"data": dshape})
with tvm.transform.PassContext(opt_level=3):
lib = relay.build(mod, target, params=params)
return lib
创建 TVM runtime,并进行推理,注意:
Use target = "cuda -libs" to enable thrust based sort, if you
enabled thrust during cmake by -DUSE_THRUST=ON.
def run(lib, dev):
# 构建 TVM runtime
m = graph_executor.GraphModule(lib["default"](dev))
tvm_input = tvm.nd.array(x.asnumpy(), device=dev)
m.set_input("data", tvm_input)
# 执行
# 得到输出
class_IDs, scores, bounding_boxs = m.get_output(0), m.get_output(1), m.get_output(2)
return class_IDs, scores, bounding_boxs
for target in ["llvm", "cuda"]:
dev = tvm.device(target, 0)
if dev.exist:
lib = build(target)
class_IDs, scores, bounding_boxs = run(lib, dev)
ax = utils.viz.plot_bbox(
脚本总运行时长:( 2 分 32.231 秒)