数据分析技能
文章平均质量分 88
AwesomeTang
这个作者很懒,什么都没留下…
展开
-
【爬虫+可视化】爬取S11期间EDG百度指数变化形成可视化图表
前言文章分为两个部分:爬虫&可视化爬虫根据关键词获取百度指数的数据,百度指数官网:https://index.baidu.com/我们打开F12打开控制台之后,在百度指数页面随便搜一个关键词,就可以在后台中轻易的找到请求:定睛一看,发现事情没那么简单:首先百度接口返回来的数据明显是经过加密的,所以想用的话,还必须得之后怎么去进行解密接着我们便通过关键词decrypt去页面中调用的js文件中进行查找,然后就找到了这么一个方法:看起来是像是用来解密的,需要两个参数,我们便可以大胆的原创 2021-11-13 13:52:09 · 1829 阅读 · 0 评论 -
【Python爬虫】爬取英雄联盟所有皮肤图片实现千图成像~
前文本文主要分为两个部分一部分是爬虫,这边是选择爬取英雄联盟官网英雄资料中的英雄皮肤图片,如下为新英雄seraphine的页面,包含英雄对应的所有皮肤;另一部分是图片的合成,先将所有英雄皮肤图片拼接成为一张图作为背景,然后与另一张图片进行合成,效果如下:爬虫思路整理F12打开控制台后刷新页面(https://lol.qq.com/data/info-defail.shtml?id=147),既然是找图片,直接在img标签下找就好了;获取到图片的地址之后(https://game.g原创 2020-11-08 00:32:09 · 5540 阅读 · 15 评论 -
嗨,介绍一款地理数据可视化神器——keplergl
简介keplergl是由Uber开源的一款地理数据可视化工具,通过keplergl我们可以在Jupyter notebook中使用,可视化效果如下图所示:安装官方文档: https://docs.kepler.gl/docs/keplergl-jupyter通过pip安装keplergl:pip install keplergl如果你使用MAC通过PIP安装而且notebook版本在5.3以上,可跳过此步:jupyter nbextension install --py --sys原创 2020-06-09 23:44:35 · 4713 阅读 · 3 评论 -
【爬虫教程】吐血整理,最详细的爬虫入门教程~
初识爬虫学习爬虫之前,我们首先得了解什么是爬虫。来自于百度百科的解释:网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。通俗来讲,假如你需要互联网上的信息,如商品价格,图片视频资源等,但你又不想或者不能自己一个一个自己去打开网页收集,这时候你便写了一个程序,让程序按照你指定好的规则去互联网上收...原创 2019-12-02 21:06:08 · 6348 阅读 · 5 评论 -
Python格式化输出——format
format OR %提到Python中的格式化输出方法,一般来说有以下两种方式:print('hello %s' % 'world')# hello worldprint('hello {}'.format('world'))# hello world到底哪种好呢,反正对我来说,用了.format()之后就再也不想用%了。format()不用理会数据类型,%s,%f等等我记不完...原创 2019-12-02 20:48:53 · 703 阅读 · 1 评论 -
【Pandas教程】像写SQL一样用Pandas~
写在最前Python在数据分析领域有三个必须需要熟悉的库,分别是pandas,numpy和matplotlib,如果排个优先级的话,我推荐先学pandas。numpy主要用于数组和矩阵的运算,一般在算法领域会应用比较多。matplotlib用于作图的话其实可替代的库会比较多,譬如有封装的更高级的seaborn,调用起来会更方便,也有交互性更强的pyecharts,风格会更讨喜。但对于p...原创 2019-12-02 20:41:13 · 672 阅读 · 0 评论