交流

今天交流所得,记下来防止忘了,后面慢慢吸收。
数据分析总的重要性:业务>数据>算法
……只有充分理解了业务,才能制定出强有力的特征,也可以指导数据的清洗,更能选择不同的机器学习算法。
从个人的发展角度来说:
…….最重要的是个人面对问题的解决思路体系,这个是自己最大的秘密武器(这方面可以看看麦肯锡的《问题分析方法与解决技巧》,以及得到上的每天听本书也不错。但是还是要注意鉴别,以及不要完全照搬,吸收对应自己的)。外层的硬实力是:shell,Python,Hadoop以及对应的系列,如spark等,以及算法,这是基本的工作技能,需要不断的学习。软实力就是沟通能力,数据分析和挖掘需要充分的理解业务,所以不可避免的需要和不同部门的同事交流。此外,沟通技巧还可以促进同事之间的情感交流。
公司里面的数据挖掘和学校的数据挖掘区别:
……一般学校的数据量都比较少,可以无脑的堆一些统计特征,然后在自己的单机上运行(包括一般的数据竞赛初期也是),运用树模型得到特征重要性,删除无用特征,对重要特征进行再次挖掘开发。但是在公司里面数据是不缺的,数据不仅在量上比较多,在维度上也是特别大,不可能像前面那样做(即使是分布式平台也无法做到),只能根据自己对业务的理解,手动的选择一些自己认为重要的特征,进行相应的处理和验证,不断重复。还有就是公司的数据很多时候是没有标签的,需要按照自己的理解对其打上标签,才能带入模型训练。
平时的目标规划:
……人都是有生活的,所以不要给自己设定每天都学习的目标,一是完成不了,二又容易导致挫败感。此外,近期的目标不要设太多,1到两个刚刚好。还有就是严格制定每天的目标,然后将本来的完成日期延迟一点,这样更能完成呢,不会因为这两天有事就突然跟不上,导致最后直接放弃。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值