数据挖掘
飞羽喂马
这个作者很懒,什么都没留下…
展开
-
机器学习KNN——Python算法实现
kNN算法是监督学习中分类方法的一种。核心思想:在训练集中选出离输入的数据点最近的k个数据,根据这k个数据的类别判断输入的数据点的类别,k个数据的类别判断方法可以是k个中出现次数最多的类别,也还可以根据距离输入点的距离计。Python版本:2.7原创 2017-01-25 14:50:47 · 870 阅读 · 0 评论 -
Python机器学习算法实践——k均值聚类(k-means)
机器学习中有两类的大问题,一个是分类,一个是聚类。分类是根据一些给定的已知类别标号的样本,训练某种学习机器,使它能够对未知类别的样本进行分类。这属于supervised learning(监督学习)。而聚类指事先并不知道任何样本的类别标号,希望通过某种算法来把一组未知类别的样本划分成若干类别,这在机器学习中被称作 unsupervised learning (无监督学习)。上一篇的knn就是监督学习分类算法,而本文的原创 2017-02-09 08:27:13 · 16255 阅读 · 11 评论 -
Python机器学习算法实践——决策树(ID3)
决策树是一种通过对特征属性属性分类对样本进行分类的树形结构原创 2017-02-24 16:42:14 · 1575 阅读 · 0 评论 -
pandas Multiindex 对层次化索引进行切片或索引
选取 DataFrame 使用正常的 loc 或 iloc 索引数据,但是对于 Multiindex 层次化索引该怎么索引数据呢?原创 2019-10-09 21:18:05 · 8813 阅读 · 1 评论