爬虫中numpy pandas的简单应用

最新推荐文章于 2023-03-04 13:29:10 发布

HappyGuya

最新推荐文章于 2023-03-04 13:29:10 发布

阅读量186

点赞数 1

文章标签： python json java 大数据机器学习

本文链接：https://blog.csdn.net/weixin_43684667/article/details/118659647

版权

爬取API数据

基础知识
利用requests库读取api中的信息

import requests
response = requests.get("https://api.github.com/users/qiwsir")    # ①
response
response.json()#以json格式输出数据
## 数据命名利用DataFrame进行整合
import pandas as pd
data = response.json()    # ②
login = data['login']     # ③
name = data['name']
blog = data['blog']
public_repos = data['public_repos']
followers = data['followers']
html_url = data['html_url']
df = pd.DataFrame([[login, name, blog, public_repos, followers, html_url]], 
                  columns=['login', 'name', 'blog', 'public_repos', 'followers', 'html_url'])    # ④
df

一个简单的项目案例


```python
import pandas as pd
data = response.json()    # ②
login = data['login']     # ③
name = data['name']
blog = data['blog']
public_repos = data['public_repos']
followers = data['followers']
html_url = data['html_url']
df = pd.DataFrame([[login, name, blog, public_repos, followers, html_url]], 
                  columns=['login', 'name', 'blog', 'public_repos', 'followers', 'html_url'])    # ④
df
url = "https://news.baidu.com/widget?id=LocalNews&ajax=json"
r = requests.get(url)
local_news = r.json()
local_news
news = local_news['data']['LocalNews']['data']['rows']['first']
news

HappyGuya

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫中numpy pandas的简单应用

爬取API数据基础知识利用requests库读取api中的信息import requestsresponse = requests.get("https://api.github.com/users/qiwsir") # ①responseresponse.json()#以json格式输出数据## 数据命名利用DataFrame进行整合import pandas as pddata = response.json() # ②login = data['login']
复制链接

扫一扫