04 理解业务和数据:我们需要做好什么计划?
业务理解跟数据理解是核心。
思想准备分 : 思想问题,业务背景与目标,把握数据。
思想问题1:避免对业务的轻视。
技术的技术的眼光看待问题。业务人员是以业务的眼光去看待问题。不同专业的人看待问题的角度是不一样。举个例子,技术人员会模糊化一些需求的特性,会很大程度去追求共性。因为本人是技术人员,所以代入感比较强。接收一个需求,最直观考虑是入参是什么,然后需要我返回什么,中间需要我做什么操作,你给的入参数据的限制区间是怎么样的,你想要的返回数据的限制区间是怎么样的。开玩笑的说,程序员眼里的客户都是客户,众生平等,都没得感情的传入参机器。但是在业务人员就不同了,他们会给客户打上标签,给于不同的权重。大客户的数据他们更关心,小而多的客户走的统一通道,大客户走vip通道。大客户出问题,业务人员炸锅,火急火燎。小客户处问题,网络波动,稍后重试。但是技术人员不应该轻视业务,中小型公司基本是以业务驱动的,都是靠业务吃饭,而非你的技术。所以数据挖掘,应该更好的重视业务,跟业务有效交流,才能做出更切合实际的技术发挥。
思想问题2:明白可以为和不可以为。
技术不是万能的。技术在进步,正是对不是万能的技术的进一步优化,创新来达成的。我们明白业务的切实需求,我们也要明白数据挖掘所要解决的点在哪里?
不同的公司,有不同的配置,不同的业务流程,不同的技术能力。实现数据挖掘也不一样的处理。
第一个是数据不完美。没有很准确的信息,或者说是准确信息没办法直接有效获取到,只能通过间接获取零散的资料。
第二个是业务条件不完美。没有办法做好百分百准备之后再上线,只能边测试边修正去修改数据的获取准确性,尽可能是我能想到的词。当在不断调整修正中,不断完善,百分比不断完善,这是一种成就感。
业务背景与目标。
结合业务,去分析能得到的数据,然后提炼自己要达成某些模型所需要的数据。
把握数据,在核对好需求之后,就是要对数据进行了解。类似可行性分析。
收集,存储,转换数据都是很重要的环节。
数据认知的层级:
1.是否有数据
2.有多少数据
3.是怎么样的数据
4.标签 (机器学习)
有很多网络上的一些网页,对应网页作用是用来引流,靠什么引流,靠的是数据挖掘之后的产出来引流。最耳熟能详的是淘宝。淘宝名词有竞品。比如你要开淘宝店,你觉得你东西没问题,你想快速做起来,然后你就会去接触网络上的,别人淘宝店怎么开,从而就会点进淘宝工具等等的网页
都是一些广告。这其中利润很大。然后是冲首页,给xxx操作费用,帮你新店上首页。但是这些网页是如何让你相信你有这个能力跟实力。对应很多都是数据挖掘。
你可以通过链接+付费功能 = 你可以看到网页上对该网页竞品分析。
你是否对应该网页背后的操作公司实力有信心些。
那么说一些背后的思维。人有我有,别人有的,我可以通过爬虫来变成我的,这里会尽量让人力搬运变成系统自动搬运。 人有我优,这个需要对同样的数据进一步数据挖掘,甚至于营销手段需要多一些噱头,我创建一个新的名词,然后给新的名词赋予新的定义,然后用我挖掘出来的数据给以赋值。简单的来提纯的话,某个竞品对应有成交量跟流量量可以直接看到,然后我进一步挖掘,给一个成交转换率 : 成交量 / 流量量 。这样的类比可以存在很多地方,有一些看你数据挖掘的角度怎么样,如果有不一样的角度,然后打造新的名词,用你提纯数据进行进一步支持。这就能产生利润。人无我有,当然这个需要你有很好的技术支持了,你能获取到一些或者是更多的业务数据,来让你案例更多来支持你的数据挖掘。
需要用大数据来做技术支持,对应程序以及机器都需要不一样的量级。不过大数据还未深入了解,这里也是做简单阐述,具体等了解之后再发表自己的言语。