模型推理:EfficientNetV2图像分类

本实验主要介绍基于MagicMind平台的EfficientNetV2图像分类推理应用的开发方法。

难易程度：中级|实验人次：4365

1. 实验内容

本实验主要介绍基于寒武纪 MLU370 MagicMind 平台的EfficientNetV2 (Tensorflow2, C++/Python3, INT8) 图像分类推理应用的开发方法。
基于 EfficientNetV2 分类网络和寒武纪 MLU370 MagicMind 平台，您可以读取本地图像数据作为输入，对图像中的物体进行分类，得到物体所属类别的概率。

寒武纪软硬件平台介绍

CVPR 2021中提出了全新的EfficientNetV2系列网络，在网络参数量更小、训练速度更快的同时，具备SOTA级别的精度。

EfficientNetV2算法作者在EfficientNetV1的基础上提出了一些改进：

V1中使用了MBConv结构，其中depthwise conv在专用加速器上的性能并不理想，作者提出了Fused-MBConv，使用conv3x3替换掉MBConv中的conv1x1和depthwise conv3x3，MBConv和Fused-MNBConv的结构如下图所示：

EfficientNetV2作为一系列网络的集合，可以通过调整深度和宽度的倍率参数，配置不同规模的网络，EfficientNetV2目前拥有S、M、L、XL，以及为了与EfficientNetV1对比使用了相同倍率参数的b0、b1、b2、b3共8种网络结构。

本次实验使用的 EfficientNetV2-S 网络结构如下表所示：

模型推理整体流程如下图所示，主要包含模型工程准备，模型生成和模型部署三部分：

STEP 1. 工程准备

STEP 2. 模型生成（Python）

模型准备与参数设置：准备MagidMind Tensorflow Parser支持的SavedModel格式的模型，设置输入尺寸、模型保存路径等参数。
Network 和 BuildConfig 配置： MagicMind ⽀持直接导⼊框架训练好的模型，并表⽰成 Network 对象。模型导⼊⼯作由 Parser 来完成。MagicMind 还提供了BuilderConfig 来配置 Builder 的行为，通过 BuilderConfig设置，用户可配置硬件平台，输入摆数，归一化参数等信息。
配置量化数据校准器：MagicMind 提供了量化校准器（Calibrator），支持 post-training 量化功能，能够基于浮点模型和样本数据计算并设置数据的分布范围，并且可以根据数据的分布特点，选择不同的量化粒度。
生成 MagicMind 模型：调用 MagicMind 的 build_model 接口生成模型，build_model ⽣成的模型中包含MLU指令、图结构等静态数据。⽣成的模型可以序列化到⽂件或内存，或从⽂件或内存反序列化，从⽽满⾜跨平台部署需求。

STEP 3. 模型推理（C++）

3. 后处理：将MLU 设备端的输出拷贝到 CPU 后，进行Softmax操作、Top5排序，根据排序结果和 ImageNet 标签得到分类结果。