数据分析
普通网友
这个作者很懒,什么都没留下…
展开
-
用Python来绘制自己的个人足迹地图,精确到市级别
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。前两年,足迹地图小程序风靡朋友圈,一时间大家都流行晒自己的旅行地图。但是,笔者最近体验了好几款足迹地图的小程序,发现这些小程序虽然号称是足迹地图,但最多只是展示到省级别,无法精确到市级别,因此,笔者周末花了点时间,用Python来绘制自己的个人足迹地图,可以精确到市级别。下面的部分,笔者将介绍如何简单地来绘制个人足迹地图。首先我们需要安装以下Python的第三方模块:原创 2020-05-31 13:41:21 · 2623 阅读 · 0 评论 -
李子柒的视频为什么这么吸引人?对她在B站上发布的视频进行分析
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者:CDA数据分析师欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。“李家有女,人称子柒。”如果说到当下最火的网红,想必很多人都会想到李子柒。日出而作,日落而息,看似平淡无奇的日子,李子柒却总能过成一首诗、一幅画。三月桃花熟了,采来酿桃花酒。四月...原创 2020-05-30 13:46:34 · 3274 阅读 · 0 评论 -
Python+matplotlib可视化设置图例4个精选案例
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。例1使用Python+matplotlib绘图进行可视化,在图形中创建轴域并设置轴域的位置和大小,同时演示设置坐标轴标签和图例位置的用法。参考代码:运行结果:例2绘制正线余弦图像,然后设置图例字体、标题、位置、阴影、背景色、边框颜色、分栏、符号位置等属性。运行效果:例3 生成模拟数据,创建两...原创 2020-05-29 20:25:18 · 1794 阅读 · 0 评论 -
熬掉了两根头发才整理出来的,python数据分析之pandas基础知识
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。1.pandas的数据结构介绍pandas的两个主要数据结构: Series和DataFrame1.1 Series1 Series的基本概念和形式Series是一种类似于一维数组的对象, 它由一组数据 (各种NumPy数据类型) 以及一组与之相关的数据标签 (即索引) 组成Series的字符串表现形式为: 索引在左边, 值在右边. 由于我们没有为数据指定索引,原创 2020-05-29 18:57:53 · 383 阅读 · 0 评论 -
用python来分析这几天的热点:5000亿资产是什么水平
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。这次数据可视化,我差点认输了故事的开头是,昨天#5000亿资产是什么水平#上了热搜,因为赌王的离去,他的家产公布激起各种白日梦想家的诞生,坐我旁边的小师妹也算了半天要是放余额宝一天得多少钱大家都是用文字来展示数据量的惊人,例如按照一年15万的平均工资来算,需要333万年,也就是在旧石器时代工作到2020年按照每天买彩票都中5百万来看,需要273年,也就是.原创 2020-05-27 21:43:53 · 521 阅读 · 0 评论 -
Python可视化图分析毛不易的《入海》,看看听歌的人都在想些什么
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。没错,还是那个B站,在520这个既浪漫且有营销价值的一天又「搞事情」了。5月20日, B站联合毛不易发布毕业季主题曲《入海》。这首歌主题是“献给即将或已经毕业的人们”,歌曲MV中以主人公毕业的时候为原点,追忆过去,并用大量篇幅展现普通人毕业后的社会生活。这首歌一经发布就在B站引爆了话题点,截止到5月24日在B站播放量达到了800万+,收获了5.2...原创 2020-05-25 14:05:26 · 722 阅读 · 0 评论 -
刚过去的520,大家都在送什么礼物,Python用可视化图告诉你
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。一年一度的520刚刚过去。由于受疫情影响错过了今年的2月14日情人节,2020年5月20日,这个谐音为“爱你爱你我爱你”的 “世纪520”,对情侣们来说显得格外有吸引力。网上都是婚礼、告白、结婚等甜蜜新闻,微博排行榜上的蜜都要溢出屏幕了,520简直就是大型“撒狗粮”节日。其中,最大的狗粮来自民政局!全国各地的民政局都爆满了!想在这天领证的新人们把民政局围得水泄不通,有人甚原创 2020-05-23 14:20:53 · 1099 阅读 · 1 评论 -
Python数据分析之双色球高频数据统计
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。Step1:基础数据准备(通过爬虫获取到),以下是从第一期03年双色球开奖号到今天的所有数据整理,截止目前一共2549期,balls.txt 文件内容如下 :备注:想要现成数据的可以给我发邮件哟~Step2:分析数据特征和数据处理方式选择,直接上代码如下:#导入Counterfrom collections import Coun...原创 2020-05-21 21:59:17 · 1645 阅读 · 1 评论 -
Python轻松实现地图可视化(附详细源码)
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。Python的地图可视化库很多,Matplotlib库虽然作图很强大,但只能做静态地图。而我今天要讲的是交互式地图库,分别为pyecharts、folium,掌握这两个库,基本可以解决你的地图可视化需求。pyecharts首先,必须说说强大的pyecharts库,简单易用又酷炫,几乎可以制作任何图表。pyecharts有v0.5和v1两个版本,两者不兼容,最新的v1版本开始支持链原创 2020-05-21 13:55:35 · 65080 阅读 · 42 评论 -
新闻数据挖掘 Python实现
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。1 提取百度新闻标题、网址、日期及来源1.1 获取网页源代码 我们通过如下代码可以获取网页源代码,示例中代码是获取在百度新闻中搜索阿里巴巴的网页源代码。import requestsheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ' ...原创 2020-05-20 13:58:46 · 1729 阅读 · 1 评论 -
Python分析101位《创造营2020》小姐姐,谁才是网友们心中的颜值担当?
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。最近可以追的综艺真是太多了,特别是女团选秀节目。之前我们刚聊过《青春有你2》,现在隔壁鹅厂的《创造营2020》又火热开播了。除了数不清的漂亮小姐姐,导师团除了黄子韬、鹿晗,最新一期中吴亦凡更是作为特约教练登场,“归国三子”一下子就引爆了话题度。01《创造营2020》到底好看吗?那么《创造营2020》到底好看吗?先让我们看到豆瓣,...原创 2020-05-18 20:47:16 · 804 阅读 · 0 评论 -
用Python统计哪个星座的富豪最多,看看你有没有成为富豪的潜质
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。最近经常看到关于星座的推送,我其实不信这个,但是由于推送得太多了,总有几篇会让我好奇地点进去看看。然后想想其实用Python写一篇星座相关的文章也不错。正好,Python计算一个人的星座特别简单,因为每个星座的日期是固定的。我们只需要四行代码就能计算:把出生的月份和日期传入这个函数,就能得到对应的星座了。当然,这只是非常简单的第一步,接下来让我们...原创 2020-05-18 15:16:21 · 318 阅读 · 0 评论 -
520快到啦,看看送哪款口红好,Python带你挑口红
前言5月在少男少女心中,有一天总是格外的特殊,尤其是对有伴侣的男性同胞来说,那天要是不送点什么东西给自己的另一半,怕是以后的日子都会不好过另外对于那些即将踏入婚姻殿堂的情侣来说,5月20日或者5月21日更加是领证的“良辰吉日”(当然要是你现在预约领证的话,怕是都已经被预约满了),作为单身狗的小编,届时看到刷屏的朋友圈以及抖音也只能趁着离5.20还有几天,相信各位男性同胞们都在苦恼不知道该送女友什么礼物才好,而口红作为百送不厌的物品之一,也是有一番讲究的。今天小编就...原创 2020-05-16 20:41:25 · 341 阅读 · 0 评论 -
一线城市的房租在工资中占比高吗?Python帮你分析
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。欢迎点击左上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、PDF电子文档、面试集锦、学习资料等。大学毕业准备实习和工作的时大家在实习和工作的时候,我们都不可避免地要面对租房的问题,尤其是想去一线城市工作。“用数据说话”这句话我们肯定再熟悉不过了,能用数据进行客观分析的,就不要拍脑袋决定。所以我用Pyth...原创 2020-05-16 20:50:16 · 224 阅读 · 0 评论 -
又到一年表白季,520它又来了!Python花式表白的几种姿势
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。大家好,520它又要来了所以今天的主题是粉色的为了各位秃头程序员不再头疼本文给大家介绍几种用Python表白的姿势绝不是画个爱心曲线那么简单~属于TA的词云用Python将你们的聊天记录/TA的朋友圈文字制作成漂亮的词云图,先来看看效果当然图片你可以随便选择,爱心、玫瑰、钻石都可以,并且关于词云图的绘制方法我们已经讲了很多,比如上面的图..原创 2020-05-16 14:55:36 · 778 阅读 · 0 评论 -
如何让数据可视化的案例不再让人烦躁?Python 的动态气泡图
1. 前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。动态的图表拥有静态图表不能比拟的优势,能够有效反映出一个变量在一段时间的变化趋势,在PPT汇报演讲中是一大加分项,而在严谨的学术图表中则不建议使用。统计学家Hans Rosling在TED上关于《亚洲何时崛起》的演讲,其所采用的数据可视化展示方法可谓是近年来经典的可视化案例之一,动态的气泡图生动的展示了中国和印度是如何在过去几十年拼命追赶欧美经济的整个过程。...原创 2020-05-16 13:56:09 · 1095 阅读 · 0 评论 -
美国超2200万人失业,根据数据用Python实现可视化图,最后有结果有点吓人
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。目前,我国新冠疫情已经大幅度好转,各省市在3到4月份已经开始复产复工,连受灾最严重的武汉也解封了,全国的情况逐渐步入正轨。但同时全球疫情十分严峻, 根据美国约翰斯.霍普金斯大学统计的数据显示,截至北京时间19日晚6时38分,全球新冠死亡病例超过16万例,达到161,324例,全球确诊病例突破230万,达2,343,293例。根据数据,目前死亡病例最多的国家..原创 2020-05-15 15:17:06 · 1704 阅读 · 0 评论 -
如果想做数据分析的,建议收藏,Python数据可视化图(附代码)
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。1、树状图树状图根据给定的距离度量将相似的点组合在一起,并根据该点的相似性将它们组织成树状链接。import scipy.cluster.hierarchy as shc# Import Datadf = pd.read_csv('https://raw.githubusercontent.com/selva86/datasets/master/U..原创 2020-05-14 16:57:22 · 1536 阅读 · 0 评论 -
实现Q版的数据可视化图,让你的数据看起来更美观
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。cutecharts简介Matplotlib默认主题下绘制的可视化图形如一位高贵冷艳、不沾烟火的冰山女神,而cutecharts的图就像不拘常规、潇洒不羁的活力少年。纤尘不染vs洒脱无畏cutecharts[1]是基于chart.xkcd的Python可视化库,chart.xkcd[2]则是基于SVG来绘制可视化图表的JavaScript库,cutec..原创 2020-05-13 14:21:57 · 517 阅读 · 0 评论 -
Python绘制数据地图可以应用与各种场景,只需要更改数据就行。
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。主要用到的新的Python模块是Geopandas,就是利用它来绘制数据地图的。Geopandas好就好在它自带了一副世界地图,具体绘制过程中不需要依赖其他的地图文件。具体实现1、导入地图此时你会发现该地图并不友好,因此需要做以下操作:a.除去南极洲b.转换投影方式2、导入数据绘制的地图为数据地图,导入数据是必然的。导入数据,并将...原创 2020-05-12 16:42:49 · 462 阅读 · 0 评论 -
解析医院药店销售数据,看看Python数据分析结果有什么惊人的发现
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。一般来说,数据分析的基本过程包括以下几个步骤:1.提出问题——即我们所想要知道的指标(平均消费额、客户的年龄分布、营业额变化趋势等等)2.导入数据——把原始数据源导入Jupyter Notebook中(网络爬虫、数据读取等)3.数据清洗——数据清洗是指发现并纠正数据文件中可识别的错误(检查数据一致性,处理无效值和缺失值等)4.构建模型(高级的模型构建会使.原创 2020-05-12 14:47:31 · 942 阅读 · 0 评论 -
大佬整理的Python数据可视化时间序列案例,建议收藏(附代码)
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。时间序列1、时间序列图时间序列图用于可视化给定指标如何随时间变化。在这里,您可以了解1949年至1969年之间的航空客运流量如何变化。# Import Datadf = pd.read_csv('https://github.com/selva86/datasets/raw/master/AirPassengers.csv')# Draw Pl..原创 2020-05-11 22:00:14 · 7122 阅读 · 2 评论 -
Python数据分析师分析自己前程,他仿佛看到了悲惨的未来
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。分析背景随着近年来人工智能和大数据的火热,越来越多的人想要从事或转行数据分析师,大家对于此行业如此的热爱,主要原因就是薪资客观,有发展前景。以我浅薄的工作经验,来谈谈对数据分析师的看法,此行业一直存在一个争议,到底是工具重要还是业务水平重要,即工具党和业务党,先站队,我是业务党(以前是工具党)。虽然我大部分时间都在做数据处理工作,这个能力也是必须的,无论是简单的EXCEL原创 2020-05-09 15:39:13 · 605 阅读 · 0 评论 -
熬夜整理的资料:分享Python数据可视化图表代码和案例给大家
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。闲话不多说,直接上干货1华夫饼图waffle可以使用该pywaffle软件包创建该图表,并用于显示较大人群中各组的组成。#!pipinstallpywaffle#Reference:https://stackoverflow.com/questions/41400136/how-to-do-waffle-charts-in-python-...原创 2020-05-09 14:50:21 · 694 阅读 · 0 评论 -
Python小知识:一个交互式可视化Python库——Bokeh
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。作者:阿川BokehBokeh是一个专门针对Web浏览器的呈现功能的交互式可视化Python库。这是Bokeh与其它可视化库最核心的区别。Bokeh绘图步骤①获取数据②构建画布figure()③添加图层,绘图line,circle,square,scatter,multi_line等;参数color,legend④自定义视觉属性⑤选择性展.原创 2020-05-09 13:34:59 · 1300 阅读 · 0 评论 -
不一样的视觉盛宴,Python实现3D地图
前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。pyecharts 功能很强大,强大到让人吃惊,它能做的事囊括爬虫、数据分析、数据可视化、游戏等等各方面,这些功能在实际的使用中应用广泛,开发程序讲究页面的美观与炫酷效果, 今天的文章将给各位读者朋友们带来不一样的视觉盛宴,感兴趣的朋友欢迎一起尝试。只需要导入相应的...原创 2020-05-08 13:51:42 · 1575 阅读 · 2 评论