- 博客(12)
- 收藏
- 关注
原创 【Educoder】— 机器学习(PCA第三关)
乳腺癌数据集,其实例数量是 569,实例中包括诊断类和属性,帮助预测的属性一共 30 个,各属性包括 radius 半径(从中心到边缘上点的距离的平均值), texture 纹理(灰度值的标准偏差)等等,类包括:WDBC-Malignant 恶性和 WDBC-Benign 良性。用数据集的 80% 作为训练集,数据集的 20% 作为测试集,训练集和测试集中都包括特征和诊断类。调用 sklearn 中的 PCA 接口来对数据继续进行降维,并使用 sklearn 中提供的分类器接口(可任意挑选分类器)对癌细胞数
2023-03-29 13:36:41 2272
原创 【Educoder】— 机器学习(聚类第三关)
Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这 4 个特征预测鸢尾花卉属于(iris-setosa,iris-versicolour,iris-virginica)中的哪一品种。任务描述:使用Python语言编程,使用 K-Means 聚类算法对 Iris 鸢尾花数据集进行分类,并使用外部指数对聚类结果进行分析。
2023-03-28 14:50:18 1240
原创 数据探索与数据预处理
数据探索与数据预处理;等深分箱;平均值平滑方法对上述数据进行平滑;最小-最大规范化;z-score规范化;小数定标规范化;等宽直方图
2022-10-22 17:13:16 2011 1
原创 python数据可视化,matplotlib画折线图,组合图
python的基本画图步骤,柱状图,折线图及其组合图,matplotlib中的一些基本参数,包括轴标签、图例、字体颜色、大小等等参数。
2022-07-05 12:43:01 1441 1
原创 matplotlib实现散点图,数据可视化
使用NumPy库读取人口数据,创建画布,并添加子图,在两个子图上分别绘制散点图和折线图,保存,显示图片,分析未来人口变化趋势,
2022-07-05 12:09:10 1889
python数据分析可视化-期末大作业-从获取到实现
2022-07-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人