- 博客(10)
- 收藏
- 关注
原创 如何使用K-means对MNIST数据集进行聚类分析
之前做过一个使用K-means对MNIST数据集进行聚类分析的简单练习,但最近在CSDN上搜索发现许多相关内容是过于复杂,不便于初学者理解,因此在这里提供一种较为简单的聚类方法。当然MNIST数据集较大,传统聚类不一定能取得较好效果,还是建议使用深度聚类算法对该数据集进行聚类分析。
2023-04-23 02:03:16 2830 1
原创 如何运用Numpy&Matplotlib&Pandas进行数据的分析和可视化
本文将介绍使用Python进行数据分析和可视化时的三个重要工具:numpy,pandas和matplotlib。
2023-02-26 15:35:08 1398
原创 如何建立随机森林、自适应增强(AdaBoost)与梯度提升(Gradient Boost)算法模型
本文将建立随机森林、自适应增强和梯度提升三个算法模型,并尝试使用堆叠算法对其进行整合
2023-02-17 23:45:13 1028 1
原创 如何建立SVM模型并进行自动调参,以及径向基核函数的SVC与Nystroem+SGD方法的训练速度比较
本练习主要分析参数变化对SVM分类效果、运算速度等的影响,并通过混淆矩阵评价分类效果。
2023-02-01 12:30:31 1932 1
原创 基于朴素贝叶斯模型的金融新闻标题情感分析
本次练习将基于金融新闻标题数据集,训练可以预测标题是积极的还是消极的的朴素贝叶斯模型,并且通过混淆矩阵和AUC曲线评判模型的预测精准度。
2023-01-24 09:38:36 722
原创 如何建立和评测基于逻辑回归的多分类预测模型
此次练习中,我们将基于数据集Human Activity Recognition Using Smartphones建立多个多分类逻辑回归模型,并通过混淆矩阵评价模型分类效果。
2023-01-20 10:56:55 2054 2
原创 基于多元线性回归模型的单车租赁数预测模型
本练习将基于kaggle竞赛中的sharebike数据集建立预测单车租赁数的多元线性回归模型,并通过RMSE,MSE等不同指标对模型进行评价。
2023-01-18 17:57:48 2599 3
原创 如何建立、调整和评测K近邻分类预测模型
在这个练习中,我们使用电信企业的客户流失数据集,Orange_Telecom_Churn_Data.csv(存放在当前目录下)。我们先读入数据集,做一些数据预处理,然后使用K近邻模型根据用户的特点来预测其是否会流失。并观察不同的K值会对模型产生何种影响。
2023-01-16 09:59:29 1287 3
原创 异方差性对多元线性回归模型的影响及其解决——基于股票信息预测的多元线性回归模型
为了减轻或消除异方差性对线性回归模型的影响,常常需要采取措施对回归模型的异方差进行修正,修正的基本思想是在确认异方差形式的基础上,采取适当的估计方法,减小或消除异方差对模型的影响。
2023-01-12 17:45:26 2449
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人