自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CDA数据分析师

专注数据科学教育16年专业品牌

  • 博客(72)
  • 资源 (4)
  • 收藏
  • 关注

原创 应该怎样规划python学习规划路线?

python现在在各行各业都有十分广泛的应用,而且近几年的市场需求也不断扩大,未来的发展前景也十分广阔,许多小伙伴想要去学习python来提高自己的职场竞争力。python学习难吗?应该怎样规划学习路线?下面跟小编一起来看吧。python学习规划第一步:python基础必学知识:python基础语法、字符串、安装python相关软件在这一阶段大家主要是对python有一个初步了解,建立正确的python编程逻辑python学习规划第二步:python编程必学知识:Pandas数据清洗、python

2020-06-30 19:28:33 937

原创 应届生没经验,怎样才能找到数据分析师工作?

没有经验是应届生的劣势,很多应届生信心满满去参加数据分析师面试,却被告知没有相关经验而被拒绝。为了帮助各位应届生小伙伴解决这一难题,小编特意整理了几种积累经验的方法,希望对大家有所帮助。方式一:自给自足可以给自己定个数据分析的项目,或者去网上搜集一些案例,自己试着操作,不要太在乎结果,最主要的是练习,积累操作经验。这样做最大好处在于,敲键盘分外熟练了,如果遇到整真正的项目最起码知道从哪里着手。方式二:刷题网上寻找各大公司的数据分析师面试题,反复进行练习。在练习过程中,你的技术熟练度和知识体系不断更新

2020-06-30 19:16:05 583

原创 数据分析师的发展方向有哪几方面?

数据分析行业大火,很多小伙伴都想转行成为数据分析师,入行容易,但重要的需要确定未来的一个发展方向,不能盲目入行。下面小编给大家分享几种数据分析师的发展方向,大家可以参考一下,首先确定好自己的目标。业务数据分析师:技能上需要会使用Excel、pythonl和SQL,因为业务数据分析师主要工作是把数据和业务结合的,用数据辅助业务增长,对于技术方面的要求一般,业务知识才是重点。数据挖掘工程师:偏向于技术一些,需要熟练运用linux操作系统、Hadoop、HDFS、MapReduce、Hive和Hbase等工具

2020-06-30 19:00:13 658

原创 分析20万条弹幕告诉你,8.9分的高分剧《隐秘的角落》到底好看在哪儿?

最近这部《隐秘的角落》彻底火了,目前在豆瓣高达8.9分,有45万余人进行了评论。一时间剧中张东升那句「爬山」、「你说我还有机会吗」 承包了6月份的梗。各种表情包和段子齐飞。作为主演秦昊当年的同学,章子怡都出来打call。刷完剧,那首「小白船」简直成了新的恐怖童谣,让人在脑海中无限循环,太上头了。那么这部制作精良的国产剧为何能收获到观众的一致好评?大家在看剧时都在讨论些什么?今天我们就用数据来带你看看。01拿拍电影的态度拍网剧 ,不好看才怪该剧改编自紫金陈推理小说《坏小孩》 ,讲述了沿海小

2020-06-30 18:11:49 577

原创 优秀的人工智能工程师需要具备哪些知识?

人工智能可谓是现阶段最火的行业,随着科技的创新与发展,在未来人工智能工程师将会是需求量最大的职业。为了适应时代发展的需求,目前很多高校都开设了人工智能相关专业,市面上也出现了许多人工智能培训机构,人工智能工程师的数量也多了起来,但是各行各业都是优胜劣汰,只有成为一名真正优秀的人工智能工程师,才能在职业竞争中脱颖而出。那么,一名优秀的人工智能工程师具备哪些知识呢?快和小编一起来看吧。1.良好的数学和统计学基础。人工智能工程师所面对的问题千变万化,无论是在抽象建模还是模型算法分析设计阶段,都需要以数学和统计学

2020-06-29 18:57:51 614

原创 这几个EXCEL实用技巧,帮你提高办公效率

EXCEL是大家办公时经常会用到的工具,下面小编介绍几种实用的EXCEL小技巧,帮助大家提高办公效率。一、为重复值添加颜色操作步骤:将数据全选→→点击菜单栏【开始】→→【样式】→→【条件格式】→→点击【突出显示单元格】→→【重复值】→→然后选择想要添加的颜色。二、快速移动/替换数据操作步骤:选择需要移动的数据→→按住shift键进行移动,移动到自己需要放的位置实现移动数据替换的方法与上面类似,但是不需要按住shift键进行操作三、表格限制内容操作步骤:点击【数据】→→【数据验证】→→下拉

2020-06-29 18:53:29 287

原创 学完python可以从事哪些工作?

不知道大家有没有遇到过这种情况,面试时被面试官问会不会用python,结果就没有结果了。于是你很气愤地向好友抱怨,我又不面技术为啥要会python,却发现你的好友正在用python下载电影。蓦然回首,大家都在学习python。你不禁会有疑问:为什么要学习python,学完就能找到工作吗?又能找到哪些工作呢?让我们先来看看python的发展前景:python在数据分析、后端开发、人工智能、运维、全栈开发等多方面都具有得天独厚的优势,与其他类型的编程语言相比,python具有容易上手,应用范围广这两个最大优点

2020-06-29 18:39:45 621

原创 程序员可以转行数据分析师吗?

数据分析师是目前最火的岗位之一,由于市场需求量大,数据分析师的薪资待遇也比较好,于是就有很多小伙伴想转行进入数据分析行业,其中不乏很多程序员朋友。许多程序员会觉得自己会编程、能开发,转行数据分析师不成问题。那么小编今天就来具体给大家分析一下。一般来说,数据分析师可以分为两个方向。一个是偏技术方面,在这一方面,各位程序员可谓是优势十足。编程代码,不成问题,也要着重提高自己的数据挖掘以及数据可视化能力,最重要的是要培养自己的数据思维,通过数据发现问题解决问题。另外一个方向就是偏业务方面,这需要很强的业务理解能

2020-06-29 18:23:23 888

原创 零基础学习数据分析,应该做哪些准备

大数据是未来发展必然趋势,不懂数据分析很可能在将来会被时代所淘汰,所以现在很多人都争抢学习数据分析,而且很多人都是零基础学习。零基础学习数据分析是有一定难度的,需要大家提前做一些准备。下面,小编就来跟大家盘点一下学习数据分析之前那些必须要做的事。1.统计学相关知识统计学是数据分析的基础,因为数据分析需要对大量数据进行统计分析,大家可以通过对统计学的学习,培养数据分析最基本的一些逻辑思维。EXCEL不要小看EXCEL,它可是最初级的数据分析工具,在处理的数据量不是很大时,EXCEL完全可以胜任。而

2020-06-28 19:49:10 252

原创 Python告诉你:粽子甜咸之争谁胜出?吃货最爱买谁家的粽子?

【导语】:今天我们来聊聊粽子,Python分析部分请看第三部分。又到一年端午节,作为中华民族的传统节日,传说粽子是为祭奠投江的屈原而传承下来的,如今吃粽子也成了端午的主要习俗之一。除了商场出售的琳琅满目的粽子,各家各户的妈妈和奶奶们也纷纷浸糯米、洗粽叶、包粽子。粽子的包法和形状也很有讲究,除了常见的三角粽、四角粽,还长粽、塔型粽和牛角粽等等。说到粽子的口味就更多了。粽子几乎每年都会引发咸甜之争,有句话说的是——吃货不分南北,口味必分甜咸。北方人吃粽子偏爱甜口,多以红枣、豆沙做馅,少数也采用果脯为馅,

2020-06-28 14:04:33 328

原创 9万条弹幕告诉你,《乘风破浪的姐姐》里谁才是真正的C位?

如果说最近最热门的综艺,那《乘风破浪的姐姐》(下文简称《姐姐》)可谓实至名归。30位出道多年的姐姐辈女艺人,一个个风格各异、个性鲜明。她们将通过合宿生活与舞台竞演,最终选出5位组成逆龄女团。《乘风破浪的姐姐》就这样突然定档、突然播出、播出前无宣发的情况下爆了,一经播出就抢占各大热搜榜。今天,我们带大家就用来盘一盘这些主要从以下几点展开:乘风破浪的姐姐?NO!是兴风作浪的姑奶奶出道时长十年起,这些姐姐们都有谁?豆瓣8.3分,姐姐们的实力妥妥的Python分析9万条弹幕,谁才是真正的C位?0.

2020-06-28 12:03:15 560

原创 线上服务器崩溃,线下门店破万,社交新宠「剧本杀」是如何迅速爆火的?

【导语】:今天我们来聊聊最近的社交游戏新宠–剧本杀,Python技术部分请看第三部分。Show me data,用数据说话今天我们聊一聊 剧本杀如果问,线下聚会可以玩儿什么?狼人杀?密室逃脱?nonono,说道现在社交游戏的新宠,就不得不提到ta——剧本杀。剧本杀,最初源于欧美派对游戏“谋杀之谜”。玩家们需要根据自己拿到的剧本扮演角色,与其他玩家一起共同演绎故事,通过线索推断、交流,共同找到凶手并揭开故事全貌。与狼人杀相似的是,二者都需要通过推理和表演找出凶手或者是掩饰自己。不同的是,狼人杀只有

2020-06-28 10:34:41 753

原创 数据分析中常用到EXCEL快捷键合集

EXCEL是数据分析入门级的工具,今天小编继续给大家带来EXCEL使用的一些小技巧——EXCEL快捷键。在分析处理庞大的数据时,EXCEL快捷键可以帮助我们提高数据分析的效率。下面,跟小编一起来看,数据分析中常用的EXCEL快捷键都有哪些吧。快速数据分析 Ctrl+Q数据提取、拆分、替换、合并Ctrl+E插入数据透视表 ALT+N+V启动数据模型 ALT+B+M删除重复值 ALT+A+M插入当前日期 Ctrl+;插入当前时间 Ctrl+Shift+;快速核对两列数据 C

2020-06-24 19:14:34 696 1

原创 建议你学习python的3个理由

Python火了,而且火得大红大紫,从工作到生活,处处都有python的身影。python 是一门兼具简单与功能强大的编程语言,它专注于如何解决问题、自由开放的社区环境以及丰富的第三方库…太专业了,我又不写编程,不学python没啥关系。错,下面就让小编来告诉你不得不学习python 的3个理由。1.市场需求无论我们从事什么工作,数据都在其中占有很大的比例。金融、互联网以及线上教育机构对于数据分析人员的需求量很大,很快数据分析技能就会像编码技能一样的重要,而 python恰好 在两个领域都占有重要的地位

2020-06-24 19:06:14 341

原创 文科生可以转行数据分析吗,应该从哪里入手?

数据分析是一个偏理科的行业,因为需要处理庞大的数据,对于文科生来说相对困难一些,但这并不代表文科生就不能转行数据分析。数据分析的最终能够目的是促进业务转化增长,所以数据分析虽然要求出炉数据的技术过硬,但是最核心的要求还是对于业务的理解能力。各位想转行的小伙伴可以找一下自己目前专业或者行业与数据分析的结合点,考虑从这方面入手。这样自己对这一领域已经有了了解,只要专心学习技术方面的知识就可以。例如,如果以前从事的是运营工作可以考虑运营+数据分析,如果以前在教育行业工作,挑选公司时,尽量还选择教育相关行业。既

2020-06-24 18:55:30 364 1

原创 数据分析面试应该准备什么?

2020年6月求职季,虽然受到疫情的影响,但是也挡不住各位小伙伴,找工作的热情。目前,数据分析行业大火,相信很多小伙伴都想去这一行业试试水。想要成功进入数据分析行业,就必须得通过数据分析面试,面试应该准备什么,怎么准备,各位小伙伴都知道吗?1.简历大家都知道面试一定要带简历,那么怎样才能制作出一份让面试官满意的简历呢。这里小编建议大家可以试试STAR法则,可以着重凸显出自己在数据分析项目中取得的成绩。另外简历一定要结合招聘要求来制作,与招聘要求的匹配度越高才更容易被hr发现,不要偷懒,用一份简历打天下

2020-06-24 18:43:09 379

原创 数据分析师将来来会不会被人工智能取代

最近数据分析行业大火,数据分析师更是被称为,“未来最具发展潜力的职业之一”,数据分析人员的前途可以说是一片光明。但是,近几年人工智能也在快速发展,有科学家预测,未来社会上有50%的职业会在十年内被人工智能所代替,尤其是一些具有重复性质的劳动在未来都会由计算机来完成。因此,很多想要入行数据分析或者已经入行的小伙伴都在担心,自己的工作将来会不会被人工智能取代,早早失业下岗。人工智能作为一门计算科学,它所做的事就是从过去的事物之间找到一定的规律,并以此来确定当下自己面临的事应该如何去做,因此对于重复性高的工作,

2020-06-23 17:27:07 591

原创 数据分析师对年龄有限制吗,是不是靠青春吃饭?

当下数据分析与人工智能发展迅速,各行各业都需要数据做支持,小到我们每个人的社交网络、运动轨迹、消费信息,大到企业的销售、运营、产品数据,都需要做数据分析。因此,数据分析师已然成为当前最火爆、最热门就业职位之一,薪资待遇和职业前景也是被好多人看好,于是乎想进入数据分析行列的人群也日益增加。但顾虑也由此产生–数据分析师是否是青春饭?如果真的是青春饭,那么超过三十岁是不是就不能入行了,即使现在入行,过几年也要被新一代的数据分析师拍死在沙滩上。小编认为,数据分析师不是靠青春吃饭的,不管现在年龄大小,想要入行就必须

2020-06-23 17:17:52 658

原创 数据分析入门,EXCEL的这几个函数你必须知道

大家整理了,数据分析入门常用的EXCEL在数据分析行业,EXCEL是最基础的、入门级的,也是最常用,最容易上手的工具了。想要学习数据分析的小伙伴可以选择先从EXCEL入手,下面小编就给函数,希望对各位小伙伴有所帮助。Excel常用函数分类:关联匹配类、清洗处理类、计算统计类逻辑运算类、、时间序列类一、关联匹配类:VLOOKUP:按列查找HLOOKUP:按行查找INDEX:返回表格或区域中的值MATCH:返回指定内容在指定区域(某行或者某列)的位置RANK:求某一个数值在某一区域内的数值排名R

2020-06-23 17:02:04 482

原创 成功入行数据分析,你必须具备这几项能力

目前数据分析行业大火,国内对于数据分析人才的需求不断扩大,而且数据分析师的薪资也是比较可观的,很多小伙伴都想抓住机遇,成功入行提薪。别急,你只有具备了这几项能力才有可能成功将进入数据分析行业。如果想入行数据分析并且找到一份高薪工作的话,可以参考招聘网站上中意公司的招聘要求,根据要求去提升相应能力。小编在参考了几个招聘网站对于数据分析师的招聘要求后,总结出了以下几项入行数据分析必须具备的能力,想要入行的小伙伴,可以参考一下。1.业务理解能力,作为企业的数据分析师一定要深入理解业务和产品的定位、以及商业逻辑

2020-06-23 16:52:15 362

原创 零基础学习数据分析,应该从哪块儿开始比较好

数据分析相关专业变得越来越火爆,最近越来越多的小伙伴都会问小编:数据分析应该从哪里学习才好?其中很多提问者之前没有相关经验和基础。作为数据分析行业的小编,是最有资格回答的,毕竟小编也是零基础学习的。先说说小编自身的情况下,文科生(小声叨叨:大学没有学过数学),以前也没接触过数据分析。小编解除数据分析是从Excel开始的。Excel也算是数据分析?大学一年级计算机一级不是考过了吗?哼,肯定会有人这么想,因为当时我也是这么想的。但其实,excel至是最基础的数据分析工具,而且小编觉得excel使用起来很方便,

2020-06-22 18:23:32 265

原创 女生适合学数据分析吗

经常会有一些想从事数据分析的女生来问小编,女生适合学做数据分析吗?哎,怎么会有这样的疑问的?要让小编来说,女生很适合做数据分析的,细心、耐心、好的交流能力、洞察力这都是女生的优势,而这又是做数据分析必备的条件。另外,从大的方面来说,将来是大数据时代,各行各业都需要数据分析,数据分析会成为职场人士的必备技能。这样来说,就不是合不合适的问题了,而是学数据分析or被淘汰的问题。或许有些女生朋友是担心数据分析的工作总是跟数据打交道,太枯燥才有上面的疑问,那么小编接下来就从职业发展的角度来给大家分析一下。简单来说

2020-06-22 18:21:13 365

原创 数据分析相关岗位目前的就业形势好吗

数据分析是时代发展的必然产物,在将来的大数据时代中,数据分析可以帮助企业清晰的了解到目前所处的的行业状态和竞争环境,辅助进行风险评判与决策。如果企业能够充分利用数据分析带来的价值,呈现给企业管理者的将是一份清晰、准确且有数据支撑的“有价值”报告,所以企业对于专业数据分析人员的需求会非常大。即使是现在,大多数的互联网,金融、教育培训,以及正在考虑转型的传统行业,都会设置专门的数据岗位,可以说是刚需了。从这次疫情也可以看出,许多大型企业都将目标转向了线上,网上教学、直播带货等现象都是最好的证明。数据分析确实是

2020-06-22 18:15:23 426

原创 一年读了100本书,感觉没半点用,那是因为方法不对……

​“书中自有黄金屋,书中自有颜如玉!”阅读是自古以来所有圣贤都很推崇的事情,然而最近小明特别迷惑,为什么他坚持在一年之内读完了100本书,到头来却发现一无所获呢?这是不是也是你的困惑?其实,读书是获取知识的途径,但并非是目的。你听过书到用时方恨少吗?阅读是个积累的过程,你不可能说读完100本书,就满腹诗书气自华了。另外,如果是有目的性需要获取某一方面的知识,有必须注意方式方法。首先,选书方面不能随心所欲,要根据你所要学习的领域精挑细选。其次,选择的书籍不能全部是技巧类书籍,任何知识都

2020-06-20 10:27:19 276

原创 电竞天才Uzi宣布退役!用数据带你回顾他的职业生涯

【导语】:今天我们来聊聊英雄联盟传奇选手Uzi,Python技术部分请看第四部分。Show me data,用数据说话最近,在被B站的「后浪」和「入海」刷屏后,一个男人也官宣了退役。他就是英雄联盟知名选手Uzi,有许多人在感慨“神退役了,我的青春结束了”。一时间Uzi的退役引起网络热议,“电竞”一词再度冲上热搜榜首,作为电竞产业快速发展过程中的代表性人物,Uzi这次在6月3日官宣由于手伤和糖尿病的身体情况影响不得以退役,不禁令人唏嘘。今天,我们就带你用数据盘点一下英雄联盟传奇选...

2020-06-19 09:43:36 974 1

原创 调整超参数:决定模型是“金子”还是“垃圾”!

数据清洗以后,你也许会困惑应该从哪里开始建模。一般情况下它的下一步应该是特征选择,但特征工程和模型训练是相互影响的。好的特征选择可以使模型得到好的效果,而不同的模型又对数据有不同的要求。因此,特征工程和模型训练是两个不可分割的部分。由于模型的选择会对特征的选择造成影响,因此,在特征工程开始前,至少应该尝试训练一些可能的模型,查看当前的特征是否适合可能的模型。如下图是建模流程的循环,特征工程和训练模型是两个动态过程。通过特征工程,选择可能的重要特征。通过参数调整,尝试训练可能的模型,从中选择最佳的模型

2020-06-17 11:18:06 315

原创 嵌套交叉验证(Nested cross-validation)

1. 传统交叉验证和嵌套交叉验证的区别在开始分享嵌套交叉验证前,首先以K-Fold为例,区分K-Fold交叉验证和嵌套K-Fold交叉验证的区别,这是我刚开示始学习时的困惑点:(1)K-Fold交叉验证:只有一个loop(循环),即内层循环(a) 将数据集切分为k-折叠;(b) 对于任意$i \in [1; k]$,在第i个折叠上测试模型,并且在剩余的折叠上训练模型;(c) 最后的结果是计算k个验证结果的均值。(2)嵌套K-Fold交叉验证:有两个loops(循环),即内层循环和外层

2020-06-17 10:25:59 5163 1

转载 魔法数字是什么?如何用数据分析找到它

来源:接地气学堂作者:接地气的陈老师花里胡哨的新词,经常给同学们带来困扰。用户增长概念火了以后,随之而来的一个魔法数字,就搞糊涂了很多人。还闹出很多笑话,比如下边这个。请听题:某互联网公司toB业务的销售运营,发现了一个魔法数字:只要销售们打电话100次以上,通话100分钟以上,成交率就会明显飙升(如下图),于是销售运营制定了双100任务,要求人人每天达到这两个指标,还在电话间挂上了“只要没打死,就往死里打”的大标语。结果搞得销售们叫苦连天,疯狂加班,还屁业绩没有,离职率也上去...

2020-06-16 13:37:01 431

原创 一小时销量破百万,Python告诉你周杰伦的《Mojito》到底有多火!

【导语】:今天我们来聊聊周杰伦的新歌《Mojito》,Python技术部分请看第三部分,Show me data,用数据说话6月12日0:00,周杰伦的最新单曲《Mojito》正式上线。对周杰伦歌迷来说,这一天简直就是过年了。因为距离周杰伦上一次发歌,已经过去了半年时间;而他的上一张专辑《周杰伦的床边故事》,已经是4年前的事情了。这首以一种传统的古巴鸡尾酒命名的《Mojito》,前奏就充满浓浓的古巴风情和拉丁节奏,整首歌都写出在遇见爱情时令人神往的浪漫情调。尤其是令人惊艳的...

2020-06-16 11:58:29 583

原创 基础知识普及:操作系统中的进程与线程!

操作系统是管理计算机硬件和软件资源的计算机程序,它管理计算机的内存分配,决定资源供需关系、控制输入输出设备以及提供用户和系统交互的操作界面简单的概括一下,操作系统就是一个管理硬件、提供用户交互的软件系统二. 操作系统的历程1. 无操作系统时代:人工操作、cup等待人工操作、资源利用率低2. 批处理系统时代:cpu无需等待人工操作、批量输入任务、资源利用率提升、多道程序设计3. 分时系统时代:多用户共享、可调试程序、资源利用率大幅提升三. 操作系统的基本功能1...

2020-06-16 11:41:13 301

原创 机器学习数据降维方法:PCA主成分分析

PCA在机器学习中很常用,是一种无参数的数据降维方法。PCA步骤:将原始数据按列组成n行m列矩阵X 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值 求出协方差矩阵 求出协方差矩阵的特征值及对应的特征向量 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P Y=PX即为降维到k维后的数据1. PCA的推导PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。我们知道PCA是一种数据降维的方法,

2020-06-16 11:27:46 732

原创 ML基础:协方差矩阵!

在翻译sklearn文档 2.无监督学习 部分过程中,发现协方差矩阵几乎贯穿整个章节,但sklearn指导手册把协方差部分放在了这一章节偏后的部分,作为机器学习一个基础概念,在这篇文章中,想把协方差矩阵的相关知识以及主要应用。统计学中常用平均值,方差,标准差等描述数据。平均值描述了样本集合的中间点;方差总是一个非负数,当随机变量的可能值集中在数学期望的附近时,方差较小; 反之, 则方差较大。所以, 由方差的大小可以推断随机变量分布的分散程度, 方差能反映随机变量的一切可能值在数学期望周围的分散程度。标准

2020-06-15 13:53:58 491

原创 地摊经济能火?别傻了,北上广不相信眼泪!

2020年,一场突如其来的疫情,减缓了中国各大城市经济的发展。随着疫情防控等级逐步下降,为拉动经济,各地纷纷出台不同政策。3月,成都允许商户在规定区域内临时占道经营,刹那间烧烤摊、服装摊、小商品摊……风靡全城。2个月后公布战果,成都中心城区餐饮店复工率超98%,解决10万人就业问题,城市活力回来了。于是乎,“地摊经济”跻身网络热词,大家茶余饭后争相谈论,更出现了很多互联网人转战摆地摊的段子。现任某公司数据分析岗的小刘也心动了,不惜动用专业数据知识,去分析卖什么东西更挣钱,跃跃欲试,准备弄

2020-06-12 13:51:52 505

原创 Pandas数据结构:DataFrame

刚刚接触pandas的朋友,想了解数据结构,就一定要认识DataFrame,接下来给大家详细介绍!初识DataFrameimport numpy as npimport pandas as pddata = {"name": ["Jack", "Tom", "LiSa"], "age": [20, 21, 18], "city": ["BeiJing", "TianJin", "ShenZhen"]}print(data)print("")frame = p

2020-06-12 11:55:07 289

原创 机器学习基础之新奇和异常值检测

异常值检测一般要求新发现的数据是否与现有观测数据具有相同的分布或者不同的分布,相同的分布可以称之为内点(inlier),具有不同分布的点可以称之为离群值。离群点和新奇点检测是不同的,有一个重要的区分必须掌握:离群点检测:训练数据包含离群点,这些离群点被定义为远离其它内点的观察值。因此,离群点检测估计器会尝试拟合出训练数据中内围点聚集的区域, 而忽略异常值观察。新奇点检测:训练数据没有受到离群点污染,我们感兴趣的是检测一个新的观测值是否为离群点。在这种情况下,离群点被认为是新奇点。离群点检测和新奇

2020-06-12 10:55:16 650

原创 机器学习经典算法之k-means聚类

聚类就是将某个数据集中的样本按照之间的某些区别划分为若干个不相交的子集,我们把每个子集称为一个“簇”。划分完成后,每个簇都可能对应着某一个类别;需说明的是,这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇对应的概念语义由使用者来把握和命名。有关聚类的算法很多,下面这张表格引用自Scikit-learn 官方文档,从这张表中可以看到各个聚类算法之间的不同以及对不同数据及划分时的匹配程度,和优劣性。我们在选择聚类算法的时候,首先一定要熟悉自己的数据,大概了解自己的数据是怎样的一个分布.

2020-06-10 14:06:31 955

原创 交叉验证:评估模型表现

注明:本文章所有代码均来自scikit-learn官方网站在实际情况中,如果一个模型要上线,数据分析员需要反复调试模型,以防止模型仅在已知数据集的表现较好,在未知数据集上的表现较差。即要确保模型的泛化能力,它指机器学习对新鲜样本的适应能力。只有保证模型的泛化能力,模型的构建才有意义。因此,交叉验证在整个建模流程中显得尤为重要。如果不对数据集进行处理,而仅是用含有标签的已知数据训练模型会得到很高分数,但却失效于对未知数据的预测,这种情况称为“过拟合”。过拟合的出现表明模型未学习到数据中的本质规律,造成

2020-06-10 13:53:58 498

原创 朴素贝叶斯(Naive Bayes)和校正曲线(Calibration Curve)

算法回顾图片来源:https://medium.com/machine-learning-101/chapter-1-supervised-learning-and-naive-bayes-classification-part-1-theory-8b9e361897d5贝叶斯分类算法属于有监督机器学习(Supervised Learning)。贝叶斯分类器是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。其中朴素贝叶斯分分类是贝叶斯分类中最简单的,也是最常见的一.

2020-06-10 13:43:05 1551

原创 ML基础:密度估计基础知识普及!

其实密度估计是一个非常简单的概念,我们已经熟悉了一种常见的密度估计技术:直方图。密度估计在无监督学习,特征工程和数据建模三个领域都有应用。高斯混合模型就是一种流行和有用的密度估计技术和基于近邻域的方法。高斯混合技术还可用作无监督聚类方案。直方图是一种最简单的数据可视化方法,可以在下图的左上面板中看到:简单的一维核密度估计 这个示例使用sklearn.neighbors。第一个图显示了使用直方图可视化一维中点密度的问题之一。直观地说,直方图可以被认为是一种方案,其中一个单元“块”被堆放在规则网格的

2020-06-10 13:25:04 656

原创 Python解读:地摊经济火了,你想好摆摊去卖什么了吗?

【导语】:今天我们来聊聊地摊经济,Python技术部分请看第四部分。Show me data,用数据说话!知乎上有一个问题:疫情结束后,你最想做的一件事是什么?有人这样回答,最想见的人就是家楼下烧烤店的老板;最想做的事,就是来一扎啤酒,来几十个串,一个人慢慢悠悠地吃,然后看着周围的人热热闹闹地聊天。一场疫情,终于不少人明白:原来摇晃的红酒杯,并不是生活的全部。平平淡淡的烟火气才是生活的真谛。最近,带着烟火气的地摊经济,火了。这一切都源于成都的一个尝试:3月,成都就出台政策,允许商户在规定区.

2020-06-09 13:55:13 993

CDA数据科学家LEVEL3考试大纲

「CDA 数据分析师人才行业标准」是面向全行业数据分析及大数据相关岗位的一套科 学化、专业化、正规化、系统化的人才技能准则。经管之家 CDA 数据分析师认证考试是评 判「标准化人才」的唯一考核路径。CDA 考试大纲规定并明确了数据分析师认证考试的具 体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人才。

2018-08-17

CDA数据分析师LEVEL2建模分析师考试大纲

「CDA 数据分析师人才行业标准」是面向全行业数据分析及大数据相关岗位的一套科 学化、专业化、正规化、系统化的人才技能准则。经管之家 CDA 数据分析师认证考试是评 判「标准化人才」的唯一考核路径。CDA 考试大纲规定并明确了数据分析师认证考试的具 体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人才。

2018-08-17

CDA大数据分析师LEVEL2考试大纲

「CDA 数据分析师人才行业标准」是面向全行业数据分析及大数据相关岗位的一套科 学化、专业化、正规化、系统化的人才技能准则。经管之家 CDA 数据分析师认证考试是评 判「标准化人才」的唯一考核路径。CDA 考试大纲规定并明确了数据分析师认证考试的具 体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人 才。

2018-08-17

CDA数据分析师LEVEL1考试大纲

「CDA 数据分析师人才行业标准」是面向全行业数据分析及大数据相关岗位的一套科 学化、专业化、正规化、系统化的人才技能准则。经管之家 CDA 数据分析师认证考试是评 判「标准化人才」的唯一考核路径。CDA 考试大纲规定并明确了数据分析师认证考试的具 体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人 才。

2018-08-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除