数据分析
文章平均质量分 52
AI悦创|编程1v1
Python一对一/编程一对一/少儿编程一对一
展开
-
2-1 什么是数据|从认输数据开始
公众号:AI悦创AI悦创:https://www.aiyc.top/1637.html原创 2021-04-15 14:47:25 · 246 阅读 · 1 评论 -
定类,定序,定距,定比四种数据类型
在这个世界上有无限多的数据,而每种数据都有属于自己的属性。那么做数据挖掘数据分析的时候,要对杂乱无章数据由一定的敏感度,学会分析数据属于哪一种类型也是一种技能。多留意身边的一些数据,试试给他分个类型也是挺好玩的一件事。如果从宏观角度分析,数据类型分为 定性 和 定量 两种。定性:变量是品质特征,如性别分男和女,是一种 特质 ;定量:变量是数值,可以量化,如身高体重等。定量又可以分为离散型和连续型,离散型一般为计数结果,如男朋友毁约的次数,连续型一般为测试结果,如女朋友身高体重的测量。那么又是怎原创 2021-03-23 10:14:53 · 21044 阅读 · 0 评论 -
啤酒与尿布的故事
这是一个很老但很有意思的故事我们去沃尔玛超市会发现一个很有趣的现象:货架上啤酒与尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢?原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的啤酒(由此看出美国人爱喝酒)。商家通过对一年多的原始交易记录进行详细的分析,发现了这对神奇的组合。于是就毫不犹豫地将尿布与啤酒摆放在一起售卖,通过它们的关联性,互相促进销售。“啤酒与尿布”的故事一度是营销界的神话。那么问题来了,商家.原创 2020-09-18 14:16:48 · 1559 阅读 · 0 评论 -
再探传说──啤酒与尿布的故事
在数据分析的领域里,有一个非常经典的故事,这个故事常常被用来强调数据分析的价值。美国大型超市沃尔玛(Walmart),利用数据分析,发现每周五的晚上,啤酒与尿布的销售量呈现正向关系。也就是每个周五的晚上时段,尿布和啤酒这两样东西一起,卖得特别好。原因竟然是,年轻父亲会去超市帮婴儿买尿布,并且顺便买啤酒回家,以便周末在家看球赛。事实上,这个故事并不是真的。2002年,北爱荷华大学教授丹尼尔‧包尔(Daniel J. Power)对「啤酒与尿布」的故事进行探源调查。他在同年七月,看了一部「欢庆啤酒尿布研原创 2020-09-18 14:14:22 · 2930 阅读 · 0 评论 -
「实战」南京房价的秘密——小区价格篇「2」
「实战」南京房价的秘密——准备篇「实战」南京房价的秘密——小区价格篇「1」案例二:南京历年小区建成情况-折线图# 计算南京历年的小区建成数量Jianzhu_tmp = Xiaoqu["建筑年代"].value_counts()Jianzhu_year = Jianzhu_tmp.sort_index().reset_index()Jianzhu_year.columns = ["year", "cnt"]# 时间跨度太大,因此选择80年以后、18年以前的数据Jianzhu_year = .原创 2020-09-12 17:55:11 · 427 阅读 · 1 评论 -
「实战」南京房价的秘密——小区价格篇「1」
你好,我是悦创。上一篇,我跟你分享了《「实战」南京房价的秘密——准备篇》,接下来我将用三篇与你分享简单的数据可视化。南京——江苏省会,国家历史文化名城,全国重要的科研教育基地和综合交通枢纽。作为长三角唯一特大城市(上海的定位为超大城市),南京的房价确实不低,从目前的发布的城市均价看,已经逼近 29000元每平米,稳稳的江苏一哥。那实际情况是什么样子呢?从这一节开始,我们就一边谈数据的可视化,一边聊南京的房价。本系列实战文章以技术讲解为主,因此对商品房的概念未做严格限制。对于部分拆迁安置房、房改房、福.原创 2020-09-04 08:03:38 · 370 阅读 · 0 评论 -
数据分析实战「一对一教学」
博客原文:https://www.aiyc.top/957.html你好,我是悦创。这里,我出了一整套的数据分析教学,你可以选择跟我买专栏。当然你也可以选择跟我视频直播课一对一来学。专栏费用:199 元,永久观看权限。视频直播:费用-4999元,腾讯会议一对一上课,永久课程回放。你将获得数据分析核心概念和工具;数据采集、清洗、分析方法论;10大数据挖掘算法精讲;Kaggle实战项目练习。课程介绍数据一直都有,但我们从未像现在这样需要数据,渴望数据,因为大数据已经改变了我们思考和决策原创 2020-09-02 14:34:49 · 655 阅读 · 0 评论 -
「实战」南京房价的秘密——准备篇
公众号:AI悦创公众号最先发送!本文给大家准备了房地产大数据,基于爬虫采集来自互联网的公开信息,数据可以分为 4块:小区信息二手房在售信息二手房成交信息租房信息为了降低数据的清洗难度,提高实战的可重现性,爬虫在设计阶段注重考虑了数据采集的规整度,因此采集到的数据相对比较干净,但是距离直接用来可视化还是有相当距离的,本文,就来帮大家把这个坑填好~房地产数据准备房价,一个离我们很近又很远的词汇。很近是因为各路专家看空看多,各类政策隔三差五,一副好不热闹的样子;很远则是因为咱也不知道哪路专家原创 2020-09-01 22:29:09 · 481 阅读 · 0 评论 -
Pandas 第一轮零基础扫盲
你好,我是悦创。欢迎关注公众号:AI悦创,抢先阅读。加入交流群。博客原文:https://www.aiyc.top/925.html为什么用 Pandas?通过对 Numpy 的学习,我们发现 Numpy 的功能确实强大且易用。但是再强大的工具也有其局限性。例如 Numpy 是基于数组的运算,但是在实际工作中,我们的数据元素会非常复杂,会同时包含文字格式、数字格式、时间格式等,显然 Numpy就不适用了。通常我们说 Numpy 是基于数组格式构建的一个数组运算工具,而 Pandas 是基于 Num原创 2020-08-31 18:51:58 · 565 阅读 · 0 评论 -
Python科学计算:用NumPy快速处理数据
你好,我是悦创。我来分享一下数据分析中 Numpy 库的使用,本文内容较多,不可能每段代码的输出过程、输出结果分析这显然工作量不是一点点。但我都结合了大量的代码块,希望小伙伴动手运行代码并分析所得到的结果。当你能做到这点的时候,在未来:不管是 Numpy 版本升级导致 API 变化还是其他,你都可以游刃有余的去解决和学习新知识。而对于结果,分析得不到的结果中规律的小伙伴呢,也不要慌。花了九块钱买的,我的服务也是要有的,如果你对本文中的示例代码的运行结果不理解或者其他问题,都可以在本文下方留言。当然,也可原创 2020-08-17 14:26:15 · 1906 阅读 · 1 评论 -
数据分析环境搭建
自学一门编程语言着实不易。从我自己的经历看,你需要翻越好几个障碍,从心态,到体力,再到思维,最终才能成为一名优秀的程序员。所以说掌握一门语言,需要你用心去感悟,去认真体会你和“她”的那一丝默契。但是遗憾的是,太多的朋友们,并不是倒在了中途,而是他们并没有开始,是的,他们连 Python 公主的纤纤玉手都没有摸到。Python 应该下载哪个版本?Python 环境如何配置?推荐几款最好用的 Python IDE 等等。我们的挑战在于选择太多,在丰收的农场门口,我们望着满眼的西瓜和葡萄,踌躇满志却不敢前原创 2020-08-03 20:33:59 · 913 阅读 · 0 评论 -
为什么Python适合数据分析?
21世纪的企业竞争是数据的竞争,谁掌握数据,谁就掌握未来。我们每个人都处于数据洪流之中,大数据可以帮助我们分析数据背后的价值。数据整合分析后得到的信息,是数据背后的价值,大数据实现了数据到信息的转化,掌握了大数据时代下的数据,就能够指导世界发展。正所谓 “工欲善其事 必先利其器” ,在时代的大背景下,选择最有前景的工具去完成手头的工作,是值得我们每个人去停下来思考的问题。最近几年,大数据、人工智能、机器学习等概念异常火爆,以至于普通人对此均有所耳闻。而 Python 语法简单灵活易学,拥有庞大的外部库原创 2020-08-03 20:00:16 · 897 阅读 · 0 评论 -
我们离不开数据分析
首先,非常感谢你订阅了AI悦创, 我会努力准备,用心书写。相信订阅的小伙伴中,有的已经工作了,可能平时还要经常加班。还有的是在校学生,我也是在校生。不过,我会每天抽时间,写点技术文章,也不知怎么地,只有这样,我才觉得一天过得充实,才觉得没有虚度。最近几年,做的这些项目,大多与数据分析与算法应用相关。岗位虽然是算法工程师,但是与数据分析打得交道也很多,双管齐下,最后才能确保算法的落地。在几年前,...原创 2019-07-26 08:31:58 · 627 阅读 · 0 评论