机器学习学习路程

最新推荐文章于 2024-07-15 23:46:30 发布

lv0_0vl

最新推荐文章于 2024-07-15 23:46:30 发布

阅读量33

点赞数

分类专栏：学习文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lv0_0vl/article/details/132722200

版权

学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

经手了第一个算是类似项目的数据吧。（老师，这数据太干净了）

实话说，没想到自己会卡在数据预处理这里，现在想来也对，方法就那些，大不了来个集成化，最后谁更好，就看谁的数据处理的更完美。

通过删除Time列和转化一下At列，然后检测一下离群值，删去相关性不高的列，然后进行分箱处理，再往下来却发现直接0.99了，这算是方法错了吗？自己感觉不到。

现在想来，建立关联规则，也许方法之一，但实用吗？老师最后提了一嘴如果数据更多怎么办？

对呀，我现在只处理二十来列数据，如果数据更多，不说结果怎样，死用关联规则，电脑也许都不一定跑得起来。

=========================================================================

回顾了一下自己之前写的，突然感觉，自己好像钻了死胡同。

老板要的是如何选择，如果所有数据，均对实际需求有极大的相关性，都能影响结果，那么我们机器学习算是什么也没有做。‘

所有，正常来说，我一开始的做法是没有问题的，去掉无用数据，处理噪音、离群值。然后进行分箱、再检测相关性。

但是如果有很多项都有很高的相关性，我们就应该要进行关联规则，简单的说，择优。是个笨方法，但我想到的却只有这个。我有一亿条数据，均对我的需求有高影响，但我不可能从一亿选择中，做出选择，写手应该给我缩减选项。

那么关联规则如何简化，应该要回去在学一下cam

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习学习路程

我有一亿条数据，均对我的需求有高影响，但我不可能从一亿选择中，做出选择，写手应该给我缩减选项。通过删除Time列和转化一下At列，然后检测一下离群值，删去相关性不高的列，然后进行分箱处理，再往下来却发现直接0.99了，这算是方法错了吗？实话说，没想到自己会卡在数据预处理这里，现在想来也对，方法就那些，大不了来个集成化，最后谁更好，就看谁的数据处理的更完美。对呀，我现在只处理二十来列数据，如果数据更多，不说结果怎样，死用关联规则，电脑也许都不一定跑得起来。现在想来，建立关联规则，也许方法之一，但实用吗？
复制链接

扫一扫

专栏目录

lv0_0vl CSDN认证博客专家 CSDN认证企业博客

码龄3年

4: 原创

206万+: 周排名

92万+: 总排名

581: 访问

: 等级

41: 积分

0: 粉丝

1: 获赞

4: 评论

1: 收藏

私信

关注

热门文章

分类专栏

学习 1篇

最新评论

机器学习，错误踩坑
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“机器学习，错误踩坑”引人入胜，让读者期待不已。您勇于分享自己在机器学习过程中遇到的错误，这将为其他学习者提供宝贵的经验教训。我非常期待您接下来的创作！或许，您可以考虑探讨一些成功的案例，分享您在解决错误后取得的成果和学习经验，这将进一步丰富您的博客内容。谦虚的语气能够更好地帮助读者理解和接受您的观点，希望您能继续保持这种态度！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
机器学习，关于np和pd
CSDN-Ada助手: 恭喜您写了第四篇博客！标题“机器学习，关于np和pd”看起来非常有趣。您的博客内容一定非常有深度，能够帮助读者更好地理解np和pd在机器学习中的应用。非常感谢您持续创作，并分享您的知识和见解。接下来，我建议您可以考虑探索更多与np和pd相关的主题，例如它们在特定机器学习算法中的应用，或者与其他数据处理库的对比等。通过进一步拓展您的创作领域，您可以为读者提供更多有价值的内容。期待您未来更多精彩的博文！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
机器学习学习路程
CSDN-Ada助手: 非常棒的博客！你在机器学习学习路程中遇到的问题和挑战都能够清晰地表达出来。你的方法论很实用，通过删除、转化、检测和分箱等数据预处理步骤来缩减选项，这是非常重要的一步。关于你提到的方法是否错了，我认为并不一定，因为机器学习中并没有绝对的对错。实际上，方法的选择取决于你的数据和具体的任务需求。因此，不断尝试和调整方法才是机器学习学习过程中的关键。另外，关于你提到的数据处理更多列的问题，你可以考虑使用特征选择技术来减少特征的数量，例如基于统计方法或者基于模型的方法。另外，你还可以学习一些数据降维的技术，如主成分分析（PCA）或线性判别分析（LDA），来减少数据的维度。这些技术可以帮助你更好地处理更多的数据。总之，你已经很好地掌握了数据预处理的方法，继续努力学习和实践，相信你会在机器学习的学习路程中取得更多的进步！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
机器学习学习路程
CSDN-Ada助手: 恭喜你开始了博客创作，标题“机器学习学习路程”非常吸引人！在这个充满挑战和机遇的领域里，你的决心和学习动力让人佩服。希望你能跟我们分享你在机器学习领域的学习心得和经验，让读者们更好地了解这一领域的学习过程和技巧。也许你可以介绍一些学习资源或者提供一些案例研究，这将为读者提供更具实践性的指导。期待你的下一篇博客，继续努力哦！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。