机器学习
no-96
这个博客留给10年后的自己
展开
-
K-近邻算法
K-近邻算法采用测量不同特征值之间的距离的方法进行分类优点:精度高,对异常值不敏感,无数据输入假定缺点:计算复杂度高,空间复杂度高适用范围:数值型和标称型算法执行描述: 对未知类别属性的数据集中的每个点执行以下操作 1.计算一致类别数据集中的点与当前点之间的距离 2.按距离递增次序排序 3.选取与当前点距离最小的K个点 4.确定前K个点出现频率最高的类别作为当前点原创 2017-11-05 11:33:12 · 249 阅读 · 0 评论 -
数据拟合
题目地址:http://www.qlcoder.com/task/763b"""有一个1000行的文本文件,文件的每一行有2个浮点数,代表一个点的坐标(x,y)。(所有点都在第一象限)请找出一条直线 Y=a*X+b,使文件中所有点和该直线的距离的和最短。保留两位小数思路:f(x) = mx + k;需要注意的地方,迭代的次数和学习速率的设置"""import numpy as npimpor原创 2017-11-19 22:11:24 · 313 阅读 · 0 评论 -
KD树算法
与传统的KNN算法比较我感觉慢很多,我的姿势是不是不对kd树import numpy as npfrom numpy import *class KDNode(): """ KDNode point:该节点的样本点 split:用于判断分割的维度(属性) left:左节点 right:右节点 """ def __init__(self原创 2017-11-23 23:01:24 · 580 阅读 · 0 评论 -
KDD99CupDataSet-SVM
KDD99CupDataSet-SVMclean data ,feature selection , svm based kdd99数据清洗数据集来源:KDD99入侵检测数据集 http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html筛选出发生在TCP层的Dos流量和normal流量 get_train_data.py 其中Dos流量的标签'原创 2018-04-12 14:04:48 · 2973 阅读 · 2 评论