机器学习的本质是分类吗?

suummy of convolutions

  • nxn image fxf filter

  • padding p stride s

(非常推荐)吴恩达老师的机器学习与深度学习

  • 课程地址:https://www.coursera.org/course/ml
  • mooc地址:https://mooc.study.163.com/university/deeplearning_ai#/c
  • 课程笔记详见这里
  • 如何理解通道数?
  • 为什么单个过滤器(卷积)的深度和通道数相同?
  • 同时使用多个过滤器,即卷积层,怎么理解?
  • 构建一个标准卷积神经网络,并准确表示所有超参数、输入输出规格
  • 构建含卷积层(conv)、池化层(pooling)、全连接层(fully connected)的卷积神经网络结构

激活函数

计算网络中, 一个节点的激活函数(Activation Function)定义了该节点在给定的输入或输入的集合下的输出

机器学习的训练教程(推荐)

使用google下的colab,其中有对机器学习的在线训练学习

https://developers.google.com/machine-learning/crash-course/

三个集合

训练集:学习样本数据集,通过匹配一些参数来建立一个分类器。建立一种分类的方式,主要是用来训练模型的。

验证集(Validation):对学习出来的模型,调整分类器的参数,如在神经网络中选择隐藏单元数。验证集还用来确定网络结构或者控制模型复杂程度的参数。

测试集:主要是测试训练好的模型的分辨能力(识别率等)

其实问题的答案是:训练集用于训练模型参数,测试集用于估计模型对样本的泛化误差,验证集用于“训练”模型的超参数。

一个典型的划分是训练集占总样本的50%,而其它各占25%,三部分都是从样本中随机抽取



优化器算法Optimizer

https://www.cnblogs.com/guoyaohua/p/8542554.html

https://zhuanlan.zhihu.com/p/32626442

自编码器

https://zhuanlan.zhihu.com/p/80377698

基于深度学习的单目深度估计综述

  • https://zhuanlan.zhihu.com/p/111759578

  • 由综述我们知道,从cvpr2018起,单目深度估计已经达到了双目深度估计的效果。

  • 但是深度估计问题中,像素点存在相对大小,因此必定涉及到回归,因此其必定是监督学习模型(泛化性能也不好)

  • 对于无监督的算法,可能场景适应性会更好,但依旧不适用于对行人深度的估计。

CVPR2018中《Deep Ordinal Regression Network for Monocular Depth Estimation》所提出的DORN框架

以3DV 2016中《Deeper Depth Prediction with Fully Convolutional Residual Networks》一文为例,其提出了FCRN网络框架