翻开自己一路写下来的机器学习的博客,有些遗憾的是:我自己都基本上理不清博客的思路。这是由我一开始定下的规则有关--只写自己不懂的地方与自己的思考,这就造成了可阅读性很差,可能在学习的工程中理解了知识点,但是对于之后自己的整理以及他人的阅读都是不方便的。反倒是需要查看别人写的相关的博客来给自己理清思路。看来我需要调整写博客的规则了--记下学习的内容,同时记下自己的不解困惑与思考。
推荐两个博客,里面也同样记录了学习机器学习这门公开课的笔记,个人认为两位都是值得我学习的对象。
雨石:http://blog.csdn.net/stdcoutzyx?viewmode=contents
Liqizhou: http://www.cnblogs.com/liqizhou/category/374888.html (SVM部分写得很棒)
回看,发现新问题如下:
(1)回归是啥意思?和拟合的区别是什么?
从网址http://blog.sina.com.cn/s/blog_53b8f53e0102e1pw.html 中得到如下解释:
Curve fitting is the process of constructing a curve, or mathematical function, that has the best fit to a series of data points, possibly subject to constraints. Curve fitting can involve either interpolation, where an exact fit to the data is required, or smoothing, in which a "smooth" function is constructed that approximately fits the data. A related topic is regression analysis, which focuses more on questions of statistical inference such as how much uncertainty is present in a curve that is fit to data observed with random errors. Fitted curves can be used as an aid for data visualization, to infer values of a function where no data are available, and to summarize the relationships among two or more variables.
对划线部分的翻译理解如下:a.曲线拟合是对一组数据构造最合适的曲线或者函数的过程(可能包含某些限制条件)。b.回归分析更多的关注点在于统计推断方面,如:由一组数据拟合出来的曲线在随机误差干扰下的不稳定性是多少;拟合的曲线可用于数据可视化、在数据不可得的情况下估计函数的值以及找到两个(或多个)变量之间的关系。
我的理解:回归分析是对拟合的进一步探讨:拟合出来的曲线的不稳定性、判断是否过拟合、相关的数值估计和变量之间的关联等。
(2)对指数分布族、广义线性模型以及朴素贝叶斯多项式事件模型这几个知识点仍然存在不太理解(感到生疏)的情况,需要加深理解。