在某种意义上说,数据分析应该是个杂家

http://www.itongji.cn/article/123015032012.html



数据分析师在某种意义上说,他应该是个杂家~他需要懂得各式各样的知识,有时候要精通,比专业的还专业,有时候,要略懂。你要保证他们所谓的专业的技术人员忽悠不了你,那你就可以了。下面是庖丁的刀对数据分析人员的素质和知识库的基本理解。希望对大家有帮助。

1.信息敏感性及搜集处理能力。

这个社会是个信息社会,信息社会的信息就会多,很多是你不需要的,很多是重复的,要么就是内容重复,要么就是架构重复。而你真正想要的信息恐怕只有沧海一粟,你就是要把这沧海一粟找出来。

处理能力是指沧海一粟的数据得到后,进行组织串联。数据组织起来才是信息。我们要的不是数字,而是信息。

训练:多看很多新闻然后串联起来,很好的训练方式是看评论,评论可以让你从多个维度去观察一个事情,这样你在搜集某个目标的相关资料时,你的维度就会比较多。

2.文化背景:熟悉各个层次的人群的属性及思维方式。

你必须了解你的领导做过什么,习惯的思维方式,否则你的报告他是看不懂的,你应该以领导的思维方式去写报告,而不是你自己的。因为你是给领导服务的。领导是你最大的客户,你的同事是你的伙伴,他们帮助你服务你的客户,而你真实的客户则是你的供货商,他们提供服务你领导一切素材。所以,你要利用你的供应商,在伙伴的帮助下,服务好你的客户。来源(公司永远不会告诉你的50个秘密)你必须理解你的‘客户’,‘伙伴’,‘供应商’在想什么,了解他们的思维方式,甚至爱吃什么,抽什么样的烟,喝什么样的咖啡,喜欢安静的喝茶,还是去泡吧。

训练:多和人交流,出去和朋友爬爬山,吃吃饭,和销售人员多学习。多和hr同学学习,看他们是怎么处理的。老员工一般女深谐此道。多和他们聊聊天,怀着一个谦卑的心。

3.熟悉心理学,并做过问卷调查等实验。

心理学必须学会,也许你是心理学毕业的,也许你说我很会说。其实一个EQ高的人和一个在社会上混了 多年的人,不用学心理学也知道你在想什么。他们都是心理学的大家,虽然他们不会提心理学这个词。不过,这个只是社交。如果做一个网站,你要考虑你的用户在 想什么,需要什么,什么情况下会到你的网站来。如果你的网站做个调查,或者要和客服咨询才能找到他要的答案,如价格,那他很可能在3秒内跳到其他网站去 了。网站的推荐功能会使这个事情变的很容易。这也许就是ucd吧。

有关心理学还是从文化看起,看看西方文化简史,毕竟现在很多东西都是泊来品。中国文化史,不是社会史,也不是技术史。多了解当前客户群的文化背景。书么,我推荐马斯洛的书,经典的黑格尔的辨证哲学有时候还是毕竟有用的,毕竟马老先生的辨证哲学是从他这里演化过来的。

有了心理学基础去设计问卷就不是什么难事了。不用担心统计用户的答卷不真实。只要不是55开,就能统计整体意向,有成熟的模型的。

训练:多买书看是其次的,看看那些老员工还是上策。至于问卷调查,现在很多,你就拿着问卷和问卷对答案的解释,慢慢的你就懂了什么答案代表什么意思。

4.熟悉相关的行业知识:营销、技术、品牌等。

行业知识是必不可少的,要了解产品,营销,战略,品牌等等是需要很长时间的,像互联网行业,你要懂 前台的ui设计,不要想加个修改功能会提供客户的满意度,但是技术实现可能要加几十个k的流量,如果是千万的用户对服务器,流量,都会压力大。而且pc, 移动终端的还要同步,更不要说,内容反复的修改了,本来说油价上涨的,可能改成奥沙利文大战希金斯了。

训练:多和这些方面的人交流吧,有些技术等,还真不是一时之功,冰冻三尺,非一日之寒。如果都懂到达他们的一般水平,没个二、三年是办不到的。

5.熟悉数学模型的缺点。

数学模型的实用都有自己的数据要求的,如对分布的数据要求均匀,不要太稀疏,欧式距离不要不均匀等 等。只有熟悉的模型的缺点和适用范围,你才能保证自己的模型应用的够顺利,不要老盯着那些传统模型不放,那些模型都很经典,经典意味着通用,以为着不适合 个例,意味着你要修改模型以适用于当前的情况,这要求你能懂的模型。

训练:数学模型的缺点需要对模型又深刻的认知,而这个数学系做过建模的人会有很大便宜,但是也不是每个数学系的人都是这样,毕竟这个是个水军流行的年代。

6.性格的韧度。

数据分析师经常会遇到这样的情况:1.辛苦做了几天的数据,对比事实根本不合理。2.由于模型的局 限性,数据的不良性产生的巨大误差。3.业务改变使自己的模型改变,进而使数据结果失效。4.报告的书写不够规范,被同事,老板骂。这些都需要我们自己去 解决,而不是抱怨。没人想听到你的抱怨和一些消极的词汇,这只会让人感觉你的个人素质不足以满足不同人的需求。

训练:怀着一个戒骄戒躁的心,去和多种人去接 触吧,坚强自信。如果真的撑不下去了,有个好办法,去跑马拉松。有些同学说,我真不想干了。回头想想,你连辞职都不怕,你还怕做不好这个工作么。不要让别 人小看了自己。不管你喜欢还是不喜欢,该你做的事情,一定要做完,做好,因为这个是你做的!

7.包容性。

每个企业,每个单位都又各式各样的人,各式各样的文化,你不仅能和容易交流的人交流,你还要能和不容易交流的人保持关系,以便顺利的完成工作。记得那谁说过:如果你一枪打不死我,我又活过来了,我们还可以做生意,只要价钱公道。数据分析师也应该有这样的精神。

训练:如果你是个小心眼的人,那么想想你的妈 妈,他们是怎么对你的,然后再看看这个城市里那些生活并不是那么宽裕的人,他们可能每天为了很少的报酬在努力,但是你依然能在他们身上找到和善的笑容。那 你还能又什么不能包容呢。多和他们聊聊天吧,你就会知道,你生活的环境是多么的优越了。不要抱怨你的同事或者老板,也许他们只是一时的性急,也许是今天他 们出门时忘记了带钥匙。对你身边的人宽容点。

8.交际能力和学习能力。

和各式各样的人交流,不只是你的公司同事,还有其他公司的,不同领域的人,这样可以使你的思维更加宽泛,数据分析师干的是脑力活,不是体力活。学习其他领域的思维演绎到自己的行业是必需的。

训练:如果你有机会多去学点其他的知识,别说 自己没时间,你统计下,你每天的时间都在干嘛,写下来,不要加任何理由。多和不同领域的朋友交流,你会身心愉悦,然后心情大好的。人不只是为了工作而活 着,生活其实还有很多更美好的事物。现在天气不错,到西湖走走也不错。品润茶楼的环境还是很美的·

9.文字功底。

你的报告不要晦涩难懂,因为你不是写古文。也不是炫耀你的文采,感情色彩那么浓,写的含情脉脉。你写的东西应该是能用3个字表述清楚的,不要用4个。你写的报告应该是冷冰冰的,像刀子一样,但又能让所有的人都看的懂,像白居易的诗。

训练:微薄是个很好的平台,用最少的字表达意思。不要老写你的心情,偶尔也写写复杂的技术,尽量条理。还有就是去看看小小说,都很短事情也清楚。真正的文献资料可以看摘要,自己写下。都短时间的微小说大赛其实很不错。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Flume中使用Kafka作为Sink的步骤如下: 1. 安装Kafka:首先需要安装Kafka,可以从官网上下载最新版本:https://kafka.apache.org/downloads 2. 配置Kafka:配置Kafka的端口号、主题名称、副本数等参数。在config/server.properties文件中进行配置。 3. 在Flume中添加Kafka Sink:在Flume配置文件中添加一个Kafka Sink,并配置它与Kafka的连接信息和主题等。 4. 启动Kafka和Flume:启动Kafka和Flume。 以下是一个示例Flume配置文件,使用Kafka作为Sink: ``` # Name the components on this agent agent.sources = source agent.sinks = kafkaSink agent.channels = memoryChannel # Describe/configure the source agent.sources.source.type = netcat agent.sources.source.bind = localhost agent.sources.source.port = 44444 # Describe the sink agent.sinks.kafkaSink.type = org.apache.flume.sink.kafka.KafkaSink agent.sinks.kafkaSink.brokerList = localhost:9092 agent.sinks.kafkaSink.topic = myTopic agent.sinks.kafkaSink.serializer.class = kafka.serializer.StringEncoder # Use a channel which buffers events in memory agent.channels.memoryChannel.type = memory agent.channels.memoryChannel.capacity = 1000 # Bind the source and sink to the channel agent.sources.source.channels = memoryChannel agent.sinks.kafkaSink.channel = memoryChannel ``` 在这个配置中,使用netcat作为源,监听本地的44444端口。在Kafka Sink中,配置连接信息和主题名称等参数。同时也使用了一个内存中间件,用于缓存事件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值