python scikit-learn机器学习算法库

http://blog.csdn.net/shizhixin/article/details/50488520
分类算法

K最近邻算法(KNN)

原理:前提邻居都已分类,离自己最近的K个样本中占多数的类别就是最终的分类类别
邻居都已分类反应在代码上就是训练集是已分类的;
不足:

样本不均衡时,会导致结果不准

解决:增加权重值

计算量大,对每一个待分类的样本,都需算出自己和全体样本的距离,才能确定K个最近邻点

解决:对全体样本进行剪辑,减小数据量

KNN算法描述:

计算已知类别数据集中的点和待分类点的距离
对距离递增排序
取前K个点
计算这K个点中,各个类别的出现频率
出现频率最高的即为分类结果

pytyon安装模块或库的三种方法:

Anaconda

python的发行版,包含常用的python库,足矣

pip

pip install 库名

源码安装

将库的源码下载下来,解压,然后进入到解压目录,执行python setup.py install,就会把这个库安装到python的默认库目录中

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值