- 博客(2)
- 收藏
- 关注
原创 计算思维与数据科学 KNN分类建模
二、实验主要内容离散化鲍鱼数据。划分训练集与测试集,并标准化数据。构建分类模型。三、实验仪器设备WindowsAnacondaSpyder四、实验步骤1、离散化鲍鱼数据由于原始数据中”sex”一列取值为字符,无法进行数学运算,将该列转换为哑变量。2、划分训练集与测试集1)分别按照8:2和5:5的比例划分训练集和测试集;2)对训练集和测试集进行标准化;3、构建分类模型1)构建KNN模型;2)训练KNN模型,预测测试集鲍鱼的年龄;对年龄预测结果进行准确率分析并做图形化展示;对比不
2021-12-12 22:52:04 1675
原创 计算思维与数据科学 K-Means聚类模型信用卡用户风险评估 python连接数据库来处理数据
实验目的1、处理信用卡数据异常值1)读取信用卡数据;2)丢弃逾期、呆账、强制停卡、退票、拒往记录为1、瑕疵户为2的记录;3)丢弃呆账、强制停卡、退票为1、拒往记录为2的记录;4)丢弃频率为5、刷卡金额不等于1的数据;2、构造信用卡客户风险评估关键特征1)根据特征瑕疵户、逾期、呆账、强制停卡记录、退票、拒往记录,构建历史行为特征(使用PCA降维);2)根据特征借款余额、个人月收入、个人月开销、家庭月收入和月刷卡额,构建出经济风险情况特征;3)根据特征职业、年龄、住家,构建出收入风险特征情况;
2021-12-12 22:49:59 2783
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人