R数据挖掘学习(方法论)

本文探讨了数据挖掘的方法论,强调理解业务知识、数据收集、数据理解和整理的重要性。通过建立数据挖掘路径,从理解业务问题、收集合适数据到数据预处理和模型构建,以解决实际的商业问题。作者分享了自己的学习历程,提醒读者避免过度关注工具,而忽视了数据分析的策略和思维过程。
摘要由CSDN通过智能技术生成

在学习任何工具之前都应该明了工具只是一种实现某种目的的手段,而方法论、思维更加重要,这才是到达最终目的地的指导,把大量的时间精力投入到孤立的工具学习上倒有些因小失大,抓小失大的嫌疑,尤其是数据挖掘这样的应用型的技能。接触到数据挖掘也才不到一年,开这个博客也是想记录自己的学习过程,巩固自己的知识,如果能给偶然看到我的胡说八道的同仁带来一点点的帮助也算是功德无量了,会开心的不得了哈哈哈哈。。。
今天第一更,讲讲数据挖掘的方法论或者说总体思维步骤。初步接触数据挖掘的PY,特别是像我这种刚接触的时候就被告知说要跑R、python,在哪个哪个期间把哪本哪本书跑完,说出来不怕笑话,我刚开始的时候连python这个单词都写不对,老写成pathon。懵懵懂懂的跟风跑完王汉生老师的《应用商务统计》(这本书是以R为工具的商业案例分析),说是跑完,其实也就是跟着这本书把书上的代码敲一遍,完了之后仔细想想什么也不知道,拿到一组数据依然不知道从何下手,不知道这个案例为什么要用这么模型,不知道这句代码为什么是这些参数,不知道Q-Q图是干什么的,不知道ROC曲线怎么看,怎样的结果表示拟合效果好?通通不知道,还要面对R时不时的红色报错!忙活半天感觉都没入门!!!
后来慢慢感受到是不是自己战略上存在不足,战术上的忙碌掩盖了战略上的错误。作为一个商学院的学生,学习数据分析数据挖掘是要解决商业问题的,是要为商业决策而服务的,而我却把重心放在工具的实现上,所以才会像个机器一样的云里雾里,像个没头苍蝇一样。后来我专门花时间上网看各种攻略各种博客,见识别人的思路方法,分析自己的需求,确定下来我学习R、python的目

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值