在 VTA 上部署来自 MxNet 的预训练视觉模型
备注
单击 此处 下载完整的示例代码
本教程提供了一个端到端 demo,介绍了如何在 VTA 加速器设计上运行 ImageNet 分类推理,执行 ImageNet 分类任务。它展示了 Relay 作为一个前端编译器,可以执行量化(VTA 仅支持 int8/32 推理)以及计算图打包(为了在 core 中启用张量),从而为硬件 target 修改计算图。
安装依赖
要在 TVM 中使用 autotvm 包,需要安装额外的依赖(如果用的是 Python2,请将「3」更改为「2」):
pip3 install --user mxnet requests "Pillow<7"
在 Python 代码中导入包:
from __future__ import absolute_import, print_function
import argparse, json, os, requests, sys, time
from io import BytesIO
from os.path import join, isfile
from PIL import Image
from mxnet.gluon.model_zoo import vision
import numpy as np
from matplotlib import pyplot as plt
import tvm
from tvm import te
from tvm import rpc, autotvm, relay
from tvm.contrib import graph_executor, utils, download
from tvm.contrib.debugger import debug_executor
from tvm.relay import transform
import vta
from vta.testing import simulator
from vta.top import graph_pack
# 确保 TVM 是使用 RPC=1 编译的
assert tvm.runtime.enabled("rpc")