相关文章
【面试】AI常见的面试问题
2025-01-03 07:07

  • https://zhuanlan.zhihu.com/p/381413759
  • https://zhuanlan.zhihu.com/p/429901476

  • CV面试(上)

  • CV面试(下)

  • https://mp.weixin.qq.com/s/ZShTaNDAMv6H6hLY9ncNTQ

  • https://zhuanlan.zhihu.com/p/82105066

  • https://github.com/andrewekhalel/MLQuestions

常用顺序
1.卷积 -> 激活 -> 池化
2.卷积 -> 池化 -> 激活
如果使用最大池化,两种顺序的结果是一样的。
如果使用平均池化,建议采用第1种顺序,即卷积 -> 激活 -> 池化。
结论
先激活,保留的有效特征(不为零的值)更多
先平均池化,会有更多的特征值变为0,不利于网络学习
上述结论,是因为使用的激活函数是ReLU,如果使用其他激活函数,如PReLU,先池化还是先激 活,两者都不会造成梯度消失。此情形下,应当优先选择先池化,再激活,以减少激活时的计算量。
3.卷积 -> BN->激活
4.卷积 -> BN->Dropout->激活
BN的作用:用于重新调整数据分布,解决传播过程中的梯度问题。
BN训练步骤
1)求解每个训练批次数据的均值。
2)求解每个训练批次数据的方差。
3)使用求得均值和方差对该批次数据做标准化处理,获得0-1分布。
4)尺度变换和偏移:使用标准化之后的x乘γ(尺度因子)调整数值,再加β(平移因子)增加偏移从而得到输出值y。引入尺度因子和平移因子解决标准化后x基本被限制在正态分布下,导致网络表达能力下降问题。
5)训练时采用一个批次中的样本的均值和标准差进行BN操作。但使用训练阶段所有批次记录的均值和方差的期望值作为预测阶段的BN均值和方差。
6)实际应用中,采用类似momentum动量法中使用的滑动平均进行计算测试时的均值和方差。
BN层优缺点
优点
1)梯度传递计算更顺畅,较少出现神经元饱和。
2)设置较大的学习率加快训练速度。
3)对模型参数的初始化方式和取值不敏感,稳固网络学习,提高模型训练精度。
4)具有一定正则效果。
缺点
1)在网络层次深的模型中会减缓训练速度。
2)训练批次建议16以上。

最新文章
那双腿真好看,像一双筷子一样直。我手机「那双腿真好看,像一双筷子一样直。」
1. 这脚油门加的刚才和同事逛街,见一美女,身材好,腿修长,我忍不住夸:“那双腿真好看,像一双筷子一样直。”同事脱口而出:
近视眼挑手机屏幕,究竟是选LCD还是OLED?手机怎么选「近视眼挑手机屏幕,究竟是选LCD还是OLED?」
最近有很个朋友正打算换机,于是他问到了笔者这里,希望我能推荐几款合适的LCD屏幕。我自己倒是很意外,没想到朋友还是LCD情怀党
苹果14传输到新手机,竟然这么简单我手机「苹果14传输到新手机,竟然这么简单」
苹果的iPhone 14系列为用户带来了卓越的性能和丰富的功能。然而,当您升级到新手机时,如何将旧手机的数据传输到新手机成为一个
郑在玹//课上玩手机被发现啦上课玩手机「郑在玹//课上玩手机被发现啦」
数学课……“唉,好烦哦,果然数学课最无聊了”你嘟囔着,左望右看着,嗯……趴到了一大片阿,我也困,想睡觉……可惜辽,数学老
手机摄影技巧手机摄影「手机摄影技巧」
手机摄影技巧:  1.了解摄影的基本元素光(顺光、侧光、顶光、逆光、黄金时段)   光是摄影的生命。有了光,万物才有了可以被
已预定x200 pro mini,分享下我的换机原因我手机「已预定x200 pro mini,分享下我的换机原因」
线下有优惠所以在线下订了,只能订512的,已经跟导购说要1t的了,到时如果没有1t的就再等等。为什么选这个机子?先说说我的用机
为什么你的外卖“烧钱”推广还是没单量?手机搜狐网「为什么你的外卖“烧钱”推广还是没单量?」
美团的竞价推广产品很多,到底我该怎么选推广产品?烧钱的速度很快,可是烧不出来几单,投入产出比极低?高度依赖推广,推广一停
“在我的手机里”是 in my phone 还是 on my phone?(音频版)我手机「“在我的手机里”是 in my phone 还是 on my phone?(音频版)」
↓↓↓点击下方卡片,发现更多精彩↓↓↓英语口语·吉米老师说“手机”的英语是 phone,那“照片在手机里”是用 in the phone 还
四十年,最具“先锋精神”的四十位作家手机搜狐网「四十年,最具“先锋精神”的四十位作家」
四十年是中国巨变的四十年,也是中国文学蓬勃发展、大浪淘沙的四十年,新时期文学尤以先锋文学成就为最;一直秉承“先锋精神”的
相关文章