python分析网页上的数据

  1. 导入模块
  2. 设置行列
  3. 读取网页数据
  4. 设置表头
  5. 删除无用的表头
import pandas as pd
# import numpy as np
# 设置最大行,最大列
pd.set_option("display.max_column", 10)
pd.set_option("display.max_row", 10)
url = "https://nba.hupu.com/standings"
res = pd.read_html(url)
# print(res)
# print(res[0])
res = res[0]
# 让第2行作为表头
res.columns = res.loc[1]
# 自由设置表头
# res.columns = ["1", "2", "2", "2", "2", "2", "2", "2", 
#  "2", "2", "2", "2", "2", "2"]
# 删掉前两行数据,不算表头
res.drop([0, 1], inplace=True)
# res.drop(1, inplace=True)
# res = res.groupby("连胜/负")
# 打印表头
print(res.head())
# 打印分组
# print(res.groups)
# 打印所有组的个数
# print(len(res.groups))
# 打印每个组的成员个数
# print(res.size())
# 对数据进行排序
# print(res.sort_values(ascending=False))
print(res.sort_values(by=['得分'], ascending=False))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

giantmfc123

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值