解决了什么问题?

如图所示, efficientNet 试图解决在构建神经网络的时候改变输入的宽度 (向量长度), 模型的层数 (深度) 以及 输入图片的分辨率对模型训练结果的影响
![[effiicientNet.png]]
“In this paper, we systematically study model scaling and identify that carefully balancing network depth, width, and resolution can lead to better performance.”

宽度问题

增大宽度可以学到更加细粒度的特征,也更容易训练,但是对于 width 很大而深度很浅的网络,往往很难学到更深层次的特征

深度问题

增大深度可能会得到更加丰富或者复杂特征的学习效果更好,但是也会遇到梯度消失、训练困难等问题
![[efficient_diff_scaling.png]]