python分析网页上的数据

最新推荐文章于 2024-05-22 14:12:33 发布

giantmfc123

最新推荐文章于 2024-05-22 14:12:33 发布

阅读量528

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mafucun1988/article/details/88417543

版权

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

导入模块
设置行列
读取网页数据
设置表头
删除无用的表头

import pandas as pd
# import numpy as np
# 设置最大行，最大列
pd.set_option("display.max_column", 10)
pd.set_option("display.max_row", 10)
url = "https://nba.hupu.com/standings"
res = pd.read_html(url)
# print(res)
# print(res[0])
res = res[0]
# 让第2行作为表头
res.columns = res.loc[1]
# 自由设置表头
# res.columns = ["1", "2", "2", "2", "2", "2", "2", "2", 
#  "2", "2", "2", "2", "2", "2"]
# 删掉前两行数据，不算表头
res.drop([0, 1], inplace=True)
# res.drop(1, inplace=True)
# res = res.groupby("连胜/负")
# 打印表头
print(res.head())
# 打印分组
# print(res.groups)
# 打印所有组的个数
# print(len(res.groups))
# 打印每个组的成员个数
# print(res.size())
# 对数据进行排序
# print(res.sort_values(ascending=False))
print(res.sort_values(by=['得分'], ascending=False))

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

giantmfc123 CSDN认证博客专家 CSDN认证企业博客

码龄7年

278: 原创

4万+: 周排名

216万+: 总排名

58万+: 访问

: 等级

6910: 积分

55: 粉丝

162: 获赞

27: 评论

692: 收藏

私信

关注

热门文章

分类专栏

Qt学习 94篇
VMware虚拟机 4篇
protobuf 3篇
Linux 13篇
理财 1篇
成长进步 53篇
log4qt 1篇
通讯协议 2篇
Dos 6篇
word 1篇
svn 2篇
概率论与数理统计 4篇
python 7篇
软件下载 1篇
软件测试 2篇
重构 84篇
rt_thread 5篇
matlab 4篇

最新评论

linux mysql 连接测试代码
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
linux mysql 连接测试代码
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
QSet转为QList
littlepriest: 过期了。
c++中负号和减号的操作符重载
Worldrebuild: 友元函数不是不能在类内定义吗？
cpp-httplib 用法
CSDN-Ada助手: 企业网络中如何进行负载均衡？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

giantmfc123 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。