学习资料:
https://woaielf.github.io/2016/09/11/data-science/
https://woaielf.github.io/2017/04/06/dm-6/
https://woaielf.github.io/page4/
使用sklearn做单机特征工程:
http://m.blog.csdn.net/MrLevo520/article/details/78085650
维基百科:https://en.wikipedia.org/wiki/Gradient_boosting#Shrinkage
归一化:http://blog.csdn.net/xbmatrix/article/details/56695825
深度学习:https://www.leiphone.com/news/201608/7lwVZCXnScbQb6cJ.html
深度学习tf:https://www.zhihu.com/question/41667903?from=profile_question_card
安装xgboost https://www.cnblogs.com/haobang008/p/5907854.html
面试题目:
http://m.blog.csdn.net/dashenghuahua/article/details/53841630
http://blog.csdn.net/xbmatrix/article/details/62056589
——————————————————————————————————
1. 讲一讲DNN
2. CNN
3. LSTM
4. 讲一讲sigmoid和reLU的区别,以及各自应该用在什么情况下
5. 讲一讲sigmoid和softmax的区别
6. 讲高维运动数据处理为什么要用谱聚类,不用别的聚类方法
7. 讲一讲LDA,模拟过程,以及训练和推断过程
8. 情景题
a 现在有一堆车牌信息(例如 京A 12345),然后是其中有百分之二十的车牌有登记时间,现在要把剩下百分之八十的车牌登记上时间,问怎么做
b 现在有人工标记的一些图片,分为五个等级(非常好,好,中,差,非常差),现在需要来预测新的图片(softmax),可是发现预测出的图片有些问题即当非常好的概率为最大时,有时候差的概率是次大的,这是不符合预期的,问应该怎么做
1. 连续监督学习有什么不同方法?滑动窗口方法2. 复发性推拉窗3. 隐藏马尔科夫模型4. 最大熵马尔科夫模型5. 条件随机域6. 图变换网络。
2. 什么是PAC学习?可能近似正确模型 (PAC)学习是一个已经被引入到分析学习算法和统计效率的学习框架
3. 有哪些不同的类别可以分为序列学习过程?序列预测2. 序列生成3. 序列识别4. 顺序决定.