1、对于理论推导部分,建立基本概念,但是不要求去实现和非常完美的理解过程,甚至可以不求胜解。
从程序员入门机器学习,因为大学数学没学好,理论部分其实比较难,但是我的想法是理论上可以记住结论。重点是要写代码去感受过程。《机器学习-实战》第5章,把代码都实现了,发现题目还是简单的。
2、有幸遇到了第一个问题。有三个参数x,y,z,随着时间连续变化。开始使用了指数加权平均,发现效果不好,代码无法做出区分。后来直接使用采集到的原始参数,错误率居然可以降到接近0,所以一开始不一定妄加判断哪种数据效果最好,可能是优化过的,可能会是原始数据。中间有个插曲,三个参数x,y,z并不是直接用在逻辑回归上。因为一般需要采集20组(x,y,z),20组数据大概2秒时间,才能描述当时状态,那怎么办呢?我把20组数据当成60个参数使用,发现居然可以使用。因为我是这么理解的,从时间序列上,10秒钟当中,2秒钟可以看出一个片段的描述,10秒里面有5个片段,那么就适用了模型。原本可能需要马尔可夫才能解决。
3、尽量使用库函数。我使用了书上的教学代码,并且在随机梯度算法上做了优化,效果比书上的好,效果也和库函数一样。最后我发现有大牛直接使用了库函数。我现在是理解算法,未来应该也是直接使用库函数比较好。