一:什么是机器学习
监督学习(supervised learning):有数据和标签;让计算机学习标签代表哪些数据。
非监督学习(un-supervised learning):只有数据没有标签;根据数据去总结分类出标签。
半监督学习(semi-supervised learning):结合监督学习和非监督学习;如何利用少量的标签,大量没有标签的样本进行训练和分类。
强化学习(Reinforcement Learning ):从经验中总结提升;规划机器人行为准则方面,将计算机丢到完全陌生环境或者让它完成一个从未接触的任务,自己尝试各种手段,最终让自己适应一个完全陌生的环境。etc:AlphaGo
遗传算法(Genetic Algorithm):与强化学习类似,适者生存,不适着淘汰准则;通过淘汰机制,选择最优的设计或模型,并且不断繁衍变异。
## 二:科普: 人工神经网络 VS 生物神经网络
三:什么是神经网络 (机器学习) what is neural network in machine learning
对复杂输入输出进行的数学建模,模拟人类神经网络
四:科普: 神经网络的黑盒不黑 (深度理解神经网络)
输入——》【代表特征->…n次转换…->代表特征】——》输出
特征 黑盒
迁移学习:保留黑盒,换掉输入输出。
五:神经网络 : 梯度下降 (Gradient Descent in Neural Nets)
神经网络是当今流行的深度学习框架,基本原理即为梯度下降机制。
最优化问题optimization problem:
1.牛顿法(Newton’s Methods)
2.最小二乘法(least squares method)
3.梯度下降法(gradient descent),神经网络是梯度下降法的一个分支。
六:什么是卷积神经网络 CNN (深度学习)
卷积、池化(下采样)、梯度下降、反向传播(backpropagation)、损失函数最小
1.信号与系统里面通常用连续函数的卷积,因此做积分运算。这里卷积实质可以理解为:系统的输出由当前时刻的输入和之前所有时刻的输入
七:什么是循环神经网络 RNN (深度学习)
八:什么是 LSTM RNN 循环神经网络 (深度学习)
九:什么是自编码 Autoencoder (深度学习)
十:什么是 GAN 生成对抗网络 (深度学习)
十一:什么是强化学习? (Reinforcement Learning)
十二:强化学习方法汇总 (Reinforcement Learning)
十三:什么是 Q Learning (Reinforcement Learning 强化学习)
十四:什么是 Sarsa (Reinforcement Learning 强化学习)
十五:什么是 Sarsa(lambda) (Reinforcement Learning 强化学习)
十六:什么是 DQN (Reinforcement Learning 强化学习)
十七:什么是 策略梯度 Policy Gradients (Reinforcement Learning 强化学习)
十八:什么是 Actor Critic (Reinforcement Learning 强化学习)
十九:什么是 Deep Deterministic Policy Gradient (DDPG) 强化学习
二十:什么是 A3C (Asynchronous Advantage Actor-Critic) 强化学习
二十一:AlphaGo Zero 为什么更厉害?
二十二:什么是遗传算法? What is Genetic Algorithm
二十三:什么是进化策略 What is Evolution Strategy
二十四:什么是神经网络进化? What is Neuro-Evolution
二十五:什么是激励函数 (深度学习)? Why need activation functions (deep learning)
二十六:怎样检验神经网络 (深度学习)
二十七:为什么要特征标准化 (深度学习)
二十八:怎样区分好用的特征 (深度学习)
二十九:什么是过拟合 (深度学习)? What is overfitting (deep learning)
三十:优化器 Optimizer 加速神经网络训练 (深度学习)
三十一:处理不均衡数据 (深度学习)
三十二:什么是 Batch Normalization 批标准化 (深度学习 deep learning)
三十三:什么是 L1 L2 正规化 正则化 Regularization (深度学习 deep learning