![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 56
那个叫马尔的大夫
山海有的是时间
展开
-
按照老师的方式,将四分位距的统计学异常检测如法炮制
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata = pd.read_excel("D:\\dataspace\\已结束项目任务数据.xls")data=pd.DataFrame(data)print(data)x0=data.iloc[:,1]x1=data.iloc[:,2]# 选取经纬度两列特征# 计算下四分位点q1=x0.quantile(0.25)print("q1",q1).原创 2021-12-11 17:00:12 · 861 阅读 · 0 评论 -
数据挖掘期中作业(用朴素贝叶斯和决策树挖掘恒星特征)
业务理解(Business Understanding)此次项目的目标是对star.csv数据集中的恒星进行分类挖掘,根据其六个特征使用不同的分类算法建模,对六个标签类别的恒星分类,并探索评估模型的效果。挖掘任务分为四部分:数据准备、数据预处理、建模实例化、评估模型。 目标 这次数据挖掘任务的目标。将star.csv数据集中的数据预处理,对非数值型的特征数据数值化。用分类器划分训练集、测试集。并用贝叶斯和决策树算法建模并训练模型,实现分类及模型评估,得到混淆矩阵、决策树分类图、热力图等成原创 2021-11-26 14:47:35 · 1336 阅读 · 2 评论