数据挖掘第四周周报

最新推荐文章于 2023-02-22 23:45:39 发布

qq_32019707

最新推荐文章于 2023-02-22 23:45:39 发布

阅读量169

点赞数

文章标签：数据挖掘

本文链接：https://blog.csdn.net/qq_32019707/article/details/109149887

版权

本周在数据挖掘项目中，利用神经网络对处理后的数据集进行分类，虽取得非随机效果，但优化困难。为提升效果，深入进行特征工程，尝试了低方差过滤、缺省值删除、高相关过滤、PCA等多种降维方法，并对数据集进行填充缺失值、分箱和字符串映射等操作。面对降维方法选择和计算效率问题，计划进一步研究和优化。

摘要由CSDN通过智能技术生成

数据挖掘第四周周报

1、本周工作
- 本周主要是实现了神经神经网络在数据集上的初步运用，在经过主观降维的数据集处理以后，对测试集进行了分类，并得到了结果。如图所示：

得到了不是0.5的结果，说明神经网络的作用还是有的，但是在经过对于迭代次数的改变和训练集的改变以后，还是没有能优化到一个更好的结果，于是乎我在考虑是不是应该回过头对特征工程进行进一步的处理，

这一周的后几天我都是在处理数据集的特征，https://zhuanlan.zhihu.com/p/43225794.在知乎和谷歌的帮助下，我对很多的降维方法进行尝试，有什么低方差过滤、缺省值删除、高相关过滤、PCA降维等方法，

trainData[numerical_fea] = trainData[numerical_fea].fillna(trainData[numerical_fea].median())
testAData[numerical_fea] = testAData[numerical_fea].fillna(testAData[numerical_fea].median())

mm = MinMaxScaler()
data = mm.fit_transform(data)

pca = PCA(n_components = 10,copy=True)
data = pca.fit_transform(data)

在结合在 “

最低0.47元/天解锁文章

qq_32019707

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘第四周周报

数据挖掘第四周周报1、本周工作本周主要是实现了神经神经网络在数据集上的初步运用，在经过主观降维的数据集处理以后，对测试集进行了分类，并得到了结果。如图所示：得到了不是0.5的结果，说明神经网络的作用还是有的，但是在经过对于迭代次数的改变和训练集的改变以后，还是没有能优化到一个更好的结果，于是乎我在考虑是不是应该回过头对特征工程进行进一步的处理，于是这一周的后几天我都是在处理数据集的特征，链接: https://zhuanlan.zhihu.com/p/43225794.在知乎和谷歌的.
复制链接

扫一扫