什么,3行Python代码就能获取海量数据?

一谈起数据分析,首先想到的就是数据,没有数据,谈何分析。

毕竟好的菜肴,没有好的原材料,是很难做的~

所以本期小F就给大家分享一个获取数据的方法,只需三行代码就能搞定。

「GoPUP」,大佬造的轮子,大概有100+的免费数据接口。

图片

GitHub:https://github.com/justinzm/gopup

使用文档:http://doc.gopup.cn/#/README

主要有指数数据、宏观经济数据、新经济数据、微博KOL数据、信息数据、生活数据、疫情数据等。

 

# 安装gopup

pip install gopup  --upgrade

 

安装成功后,就能使用了。

01 微博指数

获取指定关键词的微博指数。

 

# 微博指数

import gopup as gp

df_index = gp.weibo_index(word="马保国", time_type="1month")

print(df_index)

 

time_type="1month"; 1hour, 1day, 1month, 3month 选其一。

图片

三行Python代码实现数据获取。

02 百度指数

获取指定关键词的百度搜索指数。

 

# 百度指数

import gopup as gp

cookie = "此处输入您在网页端登录百度指数后的 cookie 数据"

index_df = gp.baidu_search_index(word="马保国", start_date='2020-11-15', end_date='2020-11-25', cookie=cookie)

print(index_df)

 

需要登陆百度指数,获取你的Cookie。

图片

设置关键词,时间起始,就能获取到马保国老师的热度数据了。

图片

后面还有百度资讯、媒体、需求图谱、人群年龄、性别、兴趣分布数据接口,就不一一介绍了。

感兴趣的同学可以自行去查看文档。

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:810735403

03 头条指数

图片

获取指定关键词的头条指数。

 

# 头条指数

import gopup as gp

index_df = gp.toutiao_index(keyword="马保国", start_date='20201115', end_date='20201125')

print(index_df)

 

接口挂了,不知为何~

还有相关性、情感、地域、城市、年龄、性别、用户阅读兴趣分析数据等接口。

04 谷歌数据

需要通过代理才能使用,不过上面这三类已经完全够用了。

 

# 谷歌数据

import gopup as gp

index_df = gp.google_index(keyword="马保国", start_date='2020-11-15T10', end_date='2020-11-25T23')

print(index_df)

 

05 宏观经济数据

有一个杠杆率的数据可以使用。

 

# 杠杆数据

import gopup as gp

df_index = gp.marco_cmlrd()

print(df_index)

 

不懂经济学,所以不明觉厉。

图片

06 新经济数据

这个数据倒是蛮有趣的,主要是公司数据。

比如独角兽和倒闭公司的数据。

 

# 独角兽公司数据

import gopup as gp

df_index = gp.nicorn_company()

print(df_index)

 

一共是240家独角兽公司。

图片

蚂蚁、字节、阿里云、滴滴,都是行业中的大佬。

 

# 倒闭公司数据

import gopup as gp

df_index = gp.death_company()

print(df_index)

 

倒闭的公司一共有6921家。

图片

看到不少P2P的公司。

剩下还有有一个特许经营许可数据,好像是吊牌销售的意思。

前段时间看到一篇文章,讲的就是南极人吊牌销售的事情,南极人都不自己搞生产,而是代工。

07 KOL数据&信息数据

主要是微博的KOL,所以没啥用。

 

# KOL数据

import gopup as gp

g = gp.pro_api(token = "……")

df_index = g.weibo_user(keyword="雷军")

print(df_index)

 

信息数据是新闻联播文字稿。

08 中国油价数据

包含汽油和柴油的调价信息数据。

 

# 油价数据

import gopup as gp

df_index = gp.energy_oil_hist()

print(df_index)

 

时间从2000年直到2020年,细数20年油价变化。

图片

09 百度迁徙数据

可以用来做飞线图或者OD图。

 

# 迁徙数据

import gopup as gp

migration_area_baidu_df = gp.migration_area_baidu(area="湖北省", indicator="move_in", date="20200201")

print(migration_area_baidu_df)

 

单次返回100个城市的数据。

图片

10 影视数据

实时电影票房数据,最近又有病例出现,数据应该也比较惨淡。

这里需要一个WebDES.js文件,才能请求成功。

 

# 实时电影票房数据

import gopup as gp

df_index = gp.realtime_boxoffice()

print(df_index)

 

「如果声音不记得」当日1千万的票房,太少了。

图片

单日影院数据,今年影院能倒闭一大堆。

 

# 单日影院数据

import gopup as gp

df_index = gp.day_cinema(date="2020-12-08")

print(df_index)

 

得到票房前100的数据。

图片

最高应该是8万多的收入。

实时电视剧播映指数,天气冷了选个好剧或者综艺,窝在被窝刷起来。

 

# 电视剧数据

import gopup as gp

df_index = gp.realtime_tv()

print(df_index)

 

大秦赋,小白也在看,感觉还不错。

图片

还有实时综艺播映指数、艺人商业价值、流量价值等数据。

11 全国高等学校数据

普通高等学校名单,包含名称、主管部门,所在省市、所在地、办学层次等信息。

 

# 普通高等学校数据

import gopup as gp

df_index = gp.university()

print(df_index)

 

一共是2631所高校。

图片

还有成人高等学校以及高等学校详情数据。

12 疫情数据

有网易、丁香园、百度三家的疫情数据。

 

# 世界历史累计确诊数据

import gopup as gp

covid_163_df = gp.covid_163(indicator="世界历史累计数据")

print(covid_163_df)

 

目前累计207个国家有疫情出现。

图片

全世界总共就233个国家和地区,快接近90%了。

在这里还是要推荐下我自己建的Python开发交流学习(qq)群:810735403,群里都是学Python开发的,如果你正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2021最新的Python进阶资料和高级开发教程,欢迎进阶中和想深入Python的小伙伴!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值