数据挖掘原理与算法
数据挖掘原理与算法
Ayakanoinu
这个人不懒,但是也不想添加个人介绍
展开
-
数据挖掘原理与算法 DBSCAN
用C实现DBSCAN,完全就是暴力模拟,用三个向量存储核心点、噪声点、边界点,先标记核心点,之后先对核心点进行聚类,将在规定范围内的核心点放入一个向量,这时得到的聚类是包含重复的,再将这个暂时得到的核心点聚类进行合并,这时得到的是核心点的分类,且这个分类包含了间接密度可达的核心点,下一步只需要将边界点加到核心点的分类中就可以。过程暴力,时间复杂度怕是要暴。#include <bits/st...原创 2019-11-09 11:07:24 · 211 阅读 · 0 评论 -
数据挖掘原理与算法 kNN算法
用于在不清楚具体分组的情况下,给待分配数据分一个组,遍历一遍所有数据即可实现,先选择前面的k个元素作为训练基础,再用后面的数据和待分配数据结合,根据距离不断替换集合里面的元素,最后得到分组,代码并不难,完全按照课本思路走即可。代码如下:#include<bits/stdc++.h>using namespace std;int k,n;struct Node{ char n...原创 2019-10-11 21:23:23 · 159 阅读 · 0 评论 -
数据挖掘原理与算法 Agnes算法
暴力解决方法,没考虑优化时间,仅仅是暴力实现,数据量很大的话会超时。#include<bits/stdc++.h>using namespace std;int n,k;struct Node{ int x,y; int id;};struct Node nodes[1005];vector<struct Node> cu[1005];double di...原创 2019-09-16 10:31:50 · 862 阅读 · 0 评论 -
数据挖掘原理与算法 K-Means算法
K-Means算法用于实现聚类需求,以K为参数,把N个对象分为个簇,以使簇内具有较高的相似度。具体实现上主要是一个循环找质心的过程,大体思路是先预处理数据,将所有点看成一个簇,找这个簇的质心,再选取离全局质心最远的一部分点作为最初选取的簇质心,这里课本上用的是随机选取一部分点作为簇质心,但是当点过多时会比较麻烦,具体解释见大佬:https://blog.csdn.net/zhihaoma/art...原创 2019-09-09 08:57:05 · 411 阅读 · 0 评论