关于论文学习中的几点疑惑
机器学习的本质是分类吗?
suummy of convolutions
nxn image fxf filter
padding p stride s
(非常推荐)吴恩达老师的机器学习与深度学习
- 课程地址:https://www.coursera.org/course/ml
- mooc地址:https://mooc.study.163.com/university/deeplearning_ai#/c
- 课程笔记详见这里
- 如何理解通道数?
- 为什么单个过滤器(卷积)的深度和通道数相同?
- 同时使用多个过滤器,即卷积层,怎么理解?
- 构建一个标准卷积神经网络,并准确表示所有超参数、输入输出规格
- 构建含卷积层(conv)、池化层(pooling)、全连接层(fully connected)的卷积神经网络结构
激活函数
在计算网络中, 一个节点的激活函数(Activation Function)定义了该节点在给定的输入或输入的集合下的输出
机器学习的训练教程(推荐)
使用google下的colab,其中有对机器学习的在线训练学习
https://developers.google.com/machine-learning/crash-course/
三个集合
训练集:学习样本数据集,通过匹配一些参数来建立一个分类器。建立一种分类的方式,主要是用来训练模型的。
验证集(Validation):对学习出来的模型,调整分类器的参数,如在神经网络中选择隐藏单元数。验证集还用来确定网络结构或者控制模型复杂程度的参数。
测试集:主要是测试训练好的模型的分辨能力(识别率等)
其实问题的答案是:训练集用于训练模型参数,测试集用于估计模型对样本的泛化误差,验证集用于“训练”模型的超参数。
一个典型的划分是训练集占总样本的50%,而其它各占25%,三部分都是从样本中随机抽取
优化器算法Optimizer
https://www.cnblogs.com/guoyaohua/p/8542554.html
https://zhuanlan.zhihu.com/p/32626442
自编码器
https://zhuanlan.zhihu.com/p/80377698
基于深度学习的单目深度估计综述
由综述我们知道,从cvpr2018起,单目深度估计已经达到了双目深度估计的效果。
但是深度估计问题中,像素点存在相对大小,因此必定涉及到回归,因此其必定是监督学习模型(泛化性能也不好)
对于无监督的算法,可能场景适应性会更好,但依旧不适用于对行人深度的估计。
CVPR2018中《Deep Ordinal Regression Network for Monocular Depth Estimation》所提出的DORN框架
以3DV 2016中《Deeper Depth Prediction with Fully Convolutional Residual Networks》一文为例,其提出了FCRN网络框架