自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 使用Scikit-Learn内置数据集进行机器学习分类实战概述

本文介绍了使用Scikit-Learn库进行多分类算法实战的完整流程。通过加载鸢尾花、手写数字等内置数据集,比较了逻辑回归、SVM、决策树等五种算法的性能表现。实验结果显示,SVM在鸢尾花数据集上表现最佳(93.33%),随机森林在葡萄酒数据集上达到100%准确率。文章还提供了数据预处理、模型评估、结果可视化的详细代码实现,并总结了实用技巧:SVM适合小数据集,树模型无需标准化,要注意类别平衡问题。最后通过特征重要性分析和混淆矩阵,对鸢尾花数据集进行了深入解读。

2025-11-22 14:13:53 728 1

原创 鸢尾花数据集分析:从数据探索到分类模型构建

鸢尾花数据集是机器学习和数据科学领域最经典的数据集之一,由统计学家Ronald Fisher在1936年提出。该数据集包含了3种鸢尾花(Setosa、Versicolour和Virginica)的150个样本,每个样本有4个特征:花萼长度(sepal length)花萼宽度(sepal width)花瓣长度(petal length)花瓣宽度(petal width)

2025-11-22 14:00:45 939 1

原创 相关性分析完全指南:从理论到实战(企鹅数据集演示)

本文介绍了相关性分析方法及其在企鹅数据集上的应用。主要内容包括:1)相关性分析概念和常用系数(皮尔逊、斯皮尔曼、肯德尔);2)使用Python对企鹅数据集进行预处理和可视化分析;3)计算不同变量间的相关系数并检验显著性;4)按物种分组进行相关性比较。结果显示,企鹅嘴长与脚蹼长度存在显著相关性(r=0.653,p<0.05),且不同物种间相关性强度存在差异。文章还提供了高级可视化技巧和结果解读指南,强调相关性不等于因果关系,并提醒注意异常值、样本量等因素对结果的影响。

2025-11-21 15:15:26 864 1

原创 UCI血压数据集最大坑:没有Patient ID,一管血当三管喝,泄露到飞起!

摘要:UCI无袖带血压数据集因缺乏患者ID导致严重数据泄露问题。该数据集将942名患者的连续波形随机切割为12,000个片段,使同一患者数据可能同时出现在训练集和测试集中,导致模型通过"背答案"获得虚高精度(MAE 1.88)。生理信号的高自相关性(SBP≥0.9)加剧了这一问题。更严重的是,该数据集与原始研究记录数量不一致(12,000 vs 4,254),且未提供患者数量等关键信息。这种数据泄露可能引发从学术研究到临床应用的连锁风险,凸显了医疗AI研究中数据划分规范的重要性。

2025-11-15 09:26:00 670 1

原创 20min分钟给华硕天选电脑添一块硬盘:0经验也能一次点亮

本文详细介绍了安装M.2固态硬盘的操作指南。准备工作包括准备工具(螺丝刀、尖嘴钳等)和防静电措施。安装步骤分为:1)正确拆除后盖;2)安装硬盘散热马甲;3)插入固态硬盘;4)系统分区;5)复原后盖。特别强调了操作注意事项,如螺丝刀型号选择、硬盘贴纸保留、散热片安装技巧等。整个流程涵盖了从硬件安装到系统设置的全过程,并反复提醒操作要轻柔谨慎,避免损坏硬件。

2025-11-13 10:20:06 259 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除