自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zclhit

全栈开发者、Thoughtworker、单板滑雪、2016深圳公益广告模特、华为云享专家

  • 博客(4)
  • 收藏
  • 关注

转载 Machine Learning in Action 学习笔记-(5)Logistic回归

logistic回归将会首次为我们引入最优化算法的分析思维,在对一系列点通过一条直线进行拟合的过程就是线性回归。寻找最佳的拟合参数,就需要用到我们常用的最优化算法。这里因为是进行二分类,所以可以使用Sigmoid函数实现分类。将线性回归问题转变为了最佳回归系数的迭代选择。梯度上升算法,随机梯度上升算法等都可以被用于这个最佳回归系数的选择过程。在预处理数据时,我们可以通过对缺失数

2016-06-05 23:55:55 1807

转载 Machine Learning in Action 学习笔记-(4)基于概率论的分类方法:朴素贝叶斯

开篇为我们讲解了许多实际应用情况下,我们可能不需要得到精准的分类,而是属于某一类的概率,以及属于其他类的概率。这里我就简单的以论坛侮辱性言语检测为例,来讲一下算法的流程。函数伪代码是:计算每个类别的文档数目对每篇训练文档:对每个类别:如果词条出现在了这个文档中->增加该文档的计数值增加所有词条的计数值对每个类别:对每个词条:将该词条的数目除以总体条数目得到条

2016-06-02 23:15:06 2051

转载 Machine Learning in Action 学习笔记-(3)决策树

决策树对于我们来说就像是一个具有终止块的流程图一样,终止块就向我们展示了分类的结果。通过使得信息熵变化至最小的原理构建我们的决策树不同的层,并且我们可以使用treePlotter.py这个模块来实现决策树的树形图绘制,能够更加直观的向我们展示决策树的结构。决策树的层数将会极大的和我们所具有的feature的数量有关,可能会存在终止块中无法准确决策出结果的情况(比如说feature过少)

2016-06-01 22:43:45 2107

转载 Machine Learning in Action 学习笔记-(2)kNN k近邻算法

kNN是最常见的聚类算法,通过比较待测被试特征与训练样本之间的欧式距离,选取k个最近的点,然后找出出现概率最高的label作为我们的预测结果。其中k的值,随机选择训练样本的方案,训练样本数目的变化都将会影响到我们最终的聚类准确率。这种基于实例的算法将会使我们无法知道平均实例样本,也将会影响到我们对于典型实例样本特征的理解。最大的收获是学会了更多的Python命令(在numPy)下的

2016-06-01 11:05:26 2031

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除