[论文笔记]An Analysis of Deep Neural Network Models for Practical Applications

6月 3 2017 Papers 5 分钟读完 (约 689 字)

本文是对现有（论文发表于2016年5月）深度网络的比较，从以下方面入手：

以下图片各模型的着色是统一的：蓝色是Inception系，绿色是VGG系，粉色是ResNet系，黄色为AlexNet系。

top1

上图是Top1准确率与模型参数数、操作数的关系。可以看到Inception系列网络以较少的参数取得相对高的准确率，而VGG系则在这一点上表现很差。

infer-batch

power-batch

上面两图分别是推断耗时和电量消耗与批量大小的关系。可以看到，两者均与批量大小无明显的相关关系。但电量消耗在不同的模型之间也非常类似，而推断时间与模型结构关系很大（VGG再次尴尬）。

mem-batch

上图展示了模型占用内存大小与批量大小的关系，大部分网络都有相对固定的内存占用，随后随批量大小的上扬而上涨。

infer-ops

从上图可以发现推断耗时和模型的操作数大体上呈现线性关系。

ops-power

电量消耗与模型的参数数、操作数并没有明显的相关性。

accuracy-infer

注意，上图中点的大小代表模型操作数，横轴代表推断效率，纵轴表示准确率。灰色区域表示模型获得了额外的推断效率或准确率，而白色区域代表非最优。

操作数越多的模型推断效率越低，大部分模型都落在相对平衡的边界上，VGG和小批量情形下的AlexNet落在了非最优区域。

从这篇论文的比较中可以看到，在特定的任务中对网络特定结构的设计（如Inception单元），即加入更强的先验知识，比堆叠网络层数更有效。深度网络还是需要人类的指导才能发挥更大的作用。

#Papers #Computer Vision #CNN