自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 数据分析与可视化,模型交叉验证,特征工程

Matplotlib是画图库,Seaborn是一个建立在Matplotlib之上的高级数据可视化库。3,特征工程,提取时间特征,均值特征,频率特征。1,数据分析与可视化。

2023-08-23 22:06:04 73

原创 机器学习完整代码及运行结果

(2)创建新的DataFrame,用于存储转换后的udmap数据,并将其与原始数据合并。此外,还要计算每个用户ID的目标值均值,创建一个决策树分类器来训练模型。(3)使用训练好的模型对测试数据进行预测,并将预测结果与测试数据的'uuid'列一起写入到'submit.csv'文件中。通过遍历字典中的key,将对应的值赋给一个零数组的对应位置,如果遇到未知情况则返回一个全零数组。4,创建全0数组,如果d=unknown,返回0,如果d!中的每列都被重命名为 'key1'、'key2'、...、'key9'

2023-08-18 20:00:27 251

原创 datawhale机器学习,薛智怀,广东金融学院(笔记2)

这个布尔(或整数)结果被存储在新的列 'udmap_isunknown' 中。因此,对于每个数据行,'udmap_isunknown' 列的值将表示该行的 'udmap' 值是否为 'unknown'。通过比较 'udmap' 列的值是否等于 'unknown',生成了一个布尔型的数据。当 'udmap' 列的值为 'unknown' 时,返回 True,否则返回 False。将布尔值转换为整数(True 转换为 1,False 转换为 0)。5,处理udmap(C列)4,处理eid(B列)

2023-08-17 21:36:58 52

原创 datawhale机器学习,薛智怀,广东金融学院(笔记1)

onethot将分类变量转化为二进制向量,每个整数代表一个类别,除了整数的索引之外其它都是0。处理的东西例如:颜色,性别,季节等。#np.zeros(9)表示创建一个全是0的数组,如果表中的数据是unknown,那数组中就是0。如果索引存在,就赋值给v。dataframe由行(rows)和列(columns)组成,index为行索引,column为列索引。# 将编码后的 udmap 特征与原始数据进行拼接,沿着列方向拼接。# 为新的特征 DataFrame 命名列名。(1,10)代表0-9,不包括10。

2023-08-16 21:36:53 59 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除