技术出身的数据分析师如何再进一个层次,成为真正的数字化人才?

1.很多技术出身的数据分析师的迷惘

工作中,很多计算机专业出身或者理工专业出身的年轻员工经常问我,怎么才能成为一名优秀的数据分析师?这些同事其实都很优秀,而且学生阶段打下的基础也很不错,Python、R等编程语言掌握的也比较好,技术方面没什么大问题。但是一到了具体的商业应用分析场景就显得捉襟见肘,比如领导让提取下XX分行的一些数据,看下存款结构,基于数据分析的提提意见建议或者写个研究报告。其实这些要求并不需要多么精深的技术操作,更多还是对业务的透彻理解,到了大公司里面,很多数据分析师是被当成是全面的数字化人才引进的,领导就默认你什么都会、都懂,在领导看了,业务不是最基础的吗,怎么会不懂业务呢?其实这也是我很想跟大家说的,到了企业工作,更重要的是为企业服务,而不是展示能力有多强,或者说,只有满足企业需求的能力才是真正的能力,所以很多时候不需要你的技术比别人有多好,更重要的是你能否顺利完成企业交办的任务,所以不仅需要一定的技术,还需要积极拓展知识面,拓展学习的广度,结合商业运营场景开展技术分析,吃透所在企业主营业务的运用逻辑,再开展数据分析,这样“用数据说话”才能说道点上,而不是光做些天花乱坠、眼花缭乱的可视化图表或者建一些复杂的模型,但实质上没有对企业营销、风控等决策起到什么作用。

2.以学以致用为导向开展学习才是王道

所以,我的观点是,学数据分析,最关键的是要有落脚场景,结合业务,以学以致用为导向开展学习。真正优秀的数据分析师,不仅仅需要懂技术,会编程语言、会软件操作;另一方面,还需要掌握一定的统计分析原理,知道每种数据挖掘算法背后的基础逻辑;再一方面,需要结合具体的业务场景,懂一些基本的商业运营逻辑,通过数据分析能够为高层决策起到智力支持的作用。

3.大小企事业单位都有很多数据分析应用场景

近年来,得益于信息技术的持续进步,数据的存储和积累可以非常便利而低成本地实现,同时大数据时代各类企事业单位的数据治理意识得到显著提升。大到大型的商业银行、电商平台,小到大街小巷采取会员制的餐饮、商店,都积累了大量的客户交易数据、消费数据和基础数据,如何实现对这些数据的开发利用呢?建立恰当的模型,从数据中挖掘出客户的行为习惯,从而更好地、更有针对性和效率性地开展市场营销、产品推广、客户关系分类维护或风险控制,进而改善经营效益、效率和效果,对各类市场经济主体都尤为重要。可以合理预期的是,大数据时代各类市场经济主体的竞争模式将会发生很大的变化,在信息不对称因素逐步得到消除,市场信息越来越透明的趋势下,谁的工作做得越精细,越具备针对性,越能抓住客户的痛点,就越能取得领先的市场竞争优势。在这种大趋势下,数据挖掘与建模大有可为。数据分析师的前景也很广阔,很多单位的招聘里面都写了一句“数字化背景人才优先”,所以大家不用担心数据分析师被边缘化,之所以有的会边缘化,是因为数据分析师自己脱离了业务,没有积极融入企业。学生时代好好学技术,学的深一些透一些,工作中就要结合企业的需要来学习了,比如学生时代学的是R而且很好,但是所在的企业就是只用Python,那么也要积极放下成见,从头学起,学海无涯呀,但是总要有目标,目标是什么?就是你所在企业的需要。

4.数据挖掘与建模的常见应用场景举例

很多技术出身的朋友还问题,能够举一些数据挖掘与建模的常见的应用场景例子,我这儿选了两个,如果大家感兴趣,后面我可以继续举例。

1. 商业银行授信客户信用风险评估

在我国,商业银行利润的主要来源是净息差收入,也就是贷款利息收入减去存款利息支出。可以说,贷款本金及利息能否顺利收回,关系着一家商业银行的经营成败。而贷款本息是否安全的问题实质上反映的是授信客户的资产质量问题,因此,各家商业银行在授信客户信用风险的识别、评估、防范和控制方面一直持续努力。在大数据技术兴起之前,商业银行一般通过人工现场或非现场调查与授信个体分析相结合的模式开展信用风险评估,这种方式在银行客户较少、数据积累不足的情况下是一种不错的选择。但是经过这么多年的发展,大多数银行发展到现在,已经积累了大量的存量客户数据或已结清授信客户数据,包括客户的基本情况、生产经营情况、财务状况、征信情况、对外担保情况、与本行的业务往来尤其是授信是否曾产生违约等,这些宝贵的数据对于商业银行在新形势下高效率做好信用风险评估工作至关重要。商业银行积极开展数据挖掘与建模,对历史数据进行分析,可以对授信客户的信用风险进行预测,从而显著提高信用风险防控效果。

2. 在电子商务平台商户营销中的应用

近年来,我国的电子商务行业实现了快速发展,批发零售行业众多商户的营销模式也实现了由线下营销为主向线上营销为主或线上线下联动营销的转变。淘宝、苏宁易购、京东、拼多多、微信等众多线上平台为商户开展线上营销提供了非常便利的条件,商户开店准入的门槛也相对较低。现在几乎大多数的商户都有自己的网店,可以通过网店开展线上销售。线上销售除了具有节省实体店面费用、扩大销售范围、节约推广费用等种种优势之外,另外一个得天独厚的优势就是在销售的过程中可以非常方便和低成本地积累大量的用户数据。这些用户数据其实是非常宝贵的信息,商家可以通过恰当的数据挖掘与建模方法,从积累的海量数据中有效探索出顾客的行为习惯,从而为开展下一阶段的营销或者上线新产品营销提供更多的技术支持,进而可以更具针对性也更节省成本和资源地达成市场目标。比如:

(1)将目标客户进行分层,分为多个集群。通过数据挖掘与建模帮助电商平台商家根据每个客户的具体特征(既包括客户的性别、地区、婚姻状况、学历水平等基本特征,也包括客户的交易次数、交易金额等交易行为习惯特征,按照一定的统计学分析规则),将现有的所有客户划分为几个或者更多的群组,进而按照群组分类施策,差异化配置营销资源,制定营销方案。

(2)研究针对某一特定产品,客户是否产生购买行为和客户特征之间的关系。模型中响应变量为客户是否产生购买行为,特征变量为每个客户的具体特征,既包括客户的性别、地区、婚姻状况、学历水平等基本特征,也包括客户的交易次数、交易金额等交易行为习惯特征。

(3)选择最有可能进行采购的联系人。通过数据挖掘与建模帮助电商平台商家研究客户的潜在购买倾向。构建并应用预测模型的过程包含两个基本步骤。第一步是使用已有的数据集(客户的购买行为和行为特征均已确定)构建模型并保存模型文件,模型中响应变量为客户是否产生购买行为,特征变量同样为每个客户的具体特征,既包括客户的性别、地区、婚姻状况、学历水平等基本特征,也包括客户的交易次数、交易金额等交易行为习惯特征。第二步是将该模型应用到其他数据集(客户的行为特征已经确定,但是购买行为未知)以获取预测结果。进而有了结果后就可以从现有客户群中选择出那些最有可能对新产品做出响应的客户,进而开展具有针对性的营销活动。

5.Python数据分析或机器学习学习书籍推荐

如果是用Python编程语言,针对数据分析或机器学习推荐两本入门级的图书:《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)。这两本书的特色是在数据分析、机器学习各种算法的介绍方面通俗易懂,较少涉及数学推导,对数学基础要求相对不高,在python代码方面讲的很细致,看了以后根据自身需要选取算法、优化代码、科学调参。

(1)《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)

《Python机器学习原理与算法实现》(杨维忠 张甜 著 2023年2月新书 清华大学出版社)内容非常详实,包含了Python和机器学习,相当于一次获得了两本书。在讲解各类机器学习算法时,逐一详解用到的各种Python代码,针对每行代码均有恰当注释(这一点基本上是大多数书目做不到的)。《Python机器学习原理与算法实现》一书创作完成后,在正式出版之前,已经开发成一套系统课程,分9次授课,在某全国性股份制商业银行内部开展了培训,490人根据行内组织统一学习,授课完成后放在知鸟平台供回放学习,9次课程累计回放量近3万次,得到参训学员的一致好评,广泛应用于各位学员的工作实践。(所以,这是一本避雷避坑、已经被亲测可行的网红书,只要用心学,都没问题哦)

(2) 《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)

《Python数据科学应用从入门到精通》一书,旨在教会读者实现全流程的数据分析,并且相对《Python机器学习原理与算法实现》一书增加了很多概念性、科普性的内容,进一步降低了学习难度。国务院发展研究中心创新发展研究部第二研究室主任杨超 ,山东大学经济学院金融系党支部书记、副主任、副教授、硕士生导师张博,山东管理学院信息工程学院院长 袁锋 教授、硕士生导师,山东大学经济学院 刘一鸣 副研究员、硕士生导师,得厚投资合伙人 张伟民等一众大牛联袂推荐。全书内容共分13章。其中第1章为数据科学应用概述,第2章讲解Python的入门基础知识,第3章讲解数据清洗。第4~6章介绍特征工程,包括特征选择、特征处理、特征提取。第7章介绍数据可视化。第8~13章介绍6种数据挖掘与建模方法,分别为线性回归、Logistic回归、决策树、随机森林、神经网络、RFM分析。从数据科学应用和Python的入门,再到数据清洗与特征工程,最终完成数据挖掘与建模或数据可视化,从而可以为读者提供“从拿到数据开始,一直到构建形成最终模型或可视化报告成果”的一站式、全流程指导。买这一本书相当于一下子得到了5本书(Python基础、数据清洗、特征工程、数据可视化、数据挖掘与建模),入门超级简单,不需要编程基础,也不需要过多数学推导,非常适用于零基础学生。

两本书随书赠送的学习资料也很多,包括全部的源代码、PPT、思维导图,还有10小时以上的讲解视频,每一章后面还有练习题及参考答案,还有学习群,相对于只看网络上的视频,一方面更加系统、高效,另一方面照着书一步步操作学起来也事半功倍。全网热销中,当当、京东等平台搜索“Python机器学习 杨维忠”“Python数据科学 杨维忠”即可。

6.SPSS的机器学习、商用建模与综合案例应用书籍推荐

关于SPSS的机器学习、商用建模与综合案例应用,推荐学习杨维忠、张甜编著,清华大学出版社出版的《SPSS统计分析商用建模与综合案例精解》。

全书共12章,第1章为SPSS操作快速入门,旨在告诉读者SPSS软件启动与关闭,数据编辑录入、数据读取、数据排序、缺失值处理、数据查找、数据合并等对数据的基础操作,教会读者如何使用SPSS处理数据。第2章为SPSS建模技术要点介绍,旨在告诉读者SPSS中的各类建模技术方法,建模中的注意事项,建模中的常见误区、需要遵循的价值导向,以及完整的研究方案设计要点等。第3章为SPSS在电子商务平台商户营销中的应用,讲解如何使用SPSS的直销模块来进行建模,以便应用到电子商务平台商户营销中。第4章为商业银行授信客户信用风险评估,讲解如何使用SPSS软件的神经网络-多层感知器,应用到商业银行授信客户信用风险评估领域。第5章为在线旅游供应商客户分类建模技术模块,讲解如何使用SPSS软件的神经网络-径向基函数,以便应用到在线旅游供应商客户分类中。第6章为小额快贷大数据审批建模技术模块,讲解如何使用SPSS软件的决策树模块,应用到小额快贷大数据审批中。第7章为汽车消费市场调研建模技术,讲解如何使用SPSS软件的联合分析模块和交叉表分析模块,应用到汽车消费市场调研中。第8章为住宅小区订奶量预测分析建模技术,讲解如何使用SPSS软件时间序列预测模块进行建模,应用到住宅小区订奶量预测分析中。第9章为手机游戏玩家体验评价影响因素分析,讲解如何使用SPSS软件的线性回归分析模块和方差分析模块,研究手机游戏玩家体验评价影响因素。第10章为家政行业客户满意度调研建模技术,讲解如何使用SPSS软件可靠性分析、描述性分析相关性分析、有序回归分析等模块开展家政行业客户满意度调研工作。第11章为软件和信息技术服务业估值建模技术,讲解如何使用SPSS软件描述性分析、相关性分析、线性回归分析研究软件和信息技术服务业上市公司估值。第12章为美容连锁企业按门店特征分类分析建模技术,讲解如何使用SPSS软件因子分析模块和聚类分析模块对美容连锁企业按门店特征分类。

综上所述,本书最大的特色和优势在于将SPSS建模技术和商业领域应用有机结合,从使用的SPSS建模技术来看,既包括传统经典的线性回归分析、相关分析、因子分析、聚类分析、描述性分析、方差分析、交叉表分析等一般统计建模技术,也包括神经网络多层感知器、径向基函数、决策树等热门大数据处理建模技术,也包括专业用于市场营销的联合分析、直销模块分析等专业建模技术。从研究应用的领域来看,全部为当下流行热门的商业运营领域,涉及的行业包括商业银行、美容连锁、汽车制造销售、电子商务、在线旅游、网络信贷、手机游戏、家政行业、奶制品行业、软件和信息技术服务业等,涉及的商业运营环节包括市场调研、市场营销、客户满意度调查、连锁门店分类管理、奶制品物流配送、客户关系分级分类维护、业务审批、消费者综合体验、上市公司估值等。

创作不易,恳请大家多多点赞支持,也欢迎大家多多关注我,让我们一起学习Python/SPSS/Stata等相关知识。

  • 50
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据科学作家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值