数据挖掘第四周周报

本周在数据挖掘项目中,利用神经网络对处理后的数据集进行分类,虽取得非随机效果,但优化困难。为提升效果,深入进行特征工程,尝试了低方差过滤、缺省值删除、高相关过滤、PCA等多种降维方法,并对数据集进行填充缺失值、分箱和字符串映射等操作。面对降维方法选择和计算效率问题,计划进一步研究和优化。
摘要由CSDN通过智能技术生成
  • 数据挖掘第四周周报
  • 1、本周工作
    • 本周主要是实现了神经神经网络在数据集上的初步运用,在经过主观降维的数据集处理以后,对测试集进行了分类,并得到了结果。如图所示:

得到了不是0.5的结果,说明神经网络的作用还是有的,但是在经过对于迭代次数的改变和训练集的改变以后,还是没有能优化到一个更好的结果,于是乎我在考虑是不是应该回过头对特征工程进行进一步的处理,

这一周的后几天我都是在处理数据集的特征,https://zhuanlan.zhihu.com/p/43225794.在知乎和谷歌的帮助下,我对很多的降维方法进行尝试,有什么低方差过滤、缺省值删除、高相关过滤、PCA降维等方法,

trainData[numerical_fea] = trainData[numerical_fea].fillna(trainData[numerical_fea].median())
testAData[numerical_fea] = testAData[numerical_fea].fillna(testAData[numerical_fea].median())

mm = MinMaxScaler()
data = mm.fit_transform(data)

pca = PCA(n_components = 10,copy=True)
data = pca.fit_transform(data)

在结合在 “

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值