数据挖掘
NCY_92377
Far from being a good programmer
展开
-
K-邻近(KNN)算法
假设绿色和蓝色是两个不同的类 如下图,红色圆要被决定赋予哪个类,是绿色还是蓝色?如果K=3,由于绿色所占比例为2/3,红色圆将被赋予绿色那个类,如果K=10,由于蓝色比例为7/10,因此红色被赋予蓝色类。 由此可见KNN算法很大程度上取决于K的选择。 实验流程图: 简单KNN算法实现如下: main.py #coding:utf-8 import sys import KNN from ...原创 2019-06-24 09:56:01 · 183 阅读 · 0 评论 -
朴素bayes实现
朴素贝叶斯理解 参考:https://www.cnblogs.com/marc01in/p/4775440.html 实验流程 代码实现 main.py #coding:utf-8 #朴素贝叶斯算法 贝叶斯估计, λ=1 K=2, S=3; λ=1 拉普拉斯平滑 import pandas as pd import numpy as np class NavieBayesB(obje...原创 2019-06-24 09:55:50 · 128 阅读 · 0 评论 -
均值漂移聚类(Mean-Shift Clustering)
参考 https://blog.csdn.net/m0_37167788/article/details/82851319 代码 main.py import numpy as np from sklearn.cluster import MeanShift, estimate_bandwidth from sklearn.datasets.samples_generator import mak...原创 2019-06-24 09:55:21 · 926 阅读 · 0 评论 -
dbscan算法
流程 代码 #-*- coding:utf-8 -*- import math import numpy as np import pylab as pl #数据集:每三个参数作为一组 data = """ 1,0.697,0.46,2,0.774,0.376,3,0.634,0.264,4,0.608,0.318,5,0.556,0.215, 6,0.403,0.237,7,0.481...原创 2019-06-24 09:55:03 · 138 阅读 · 0 评论 -
BP神经网络
流程 code import numpy as np # 定义tanh函数 def tanh(x): return np.tanh(x) # tanh函数的导数 def tan_deriv(x): return 1.0 - np.tanh(x) * np.tan(x) # sigmoid函数 def logistic(x): return 1 / (1 + np....原创 2019-06-24 09:54:46 · 139 阅读 · 0 评论