Python 导入HTML网页数据

最新推荐文章于 2024-07-29 02:32:41 发布

慕白啊。

最新推荐文章于 2024-07-29 02:32:41 发布

阅读量3.2k

点赞数 2

分类专栏： python 导入HTML文件文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_34991100/article/details/117467672

版权

python 导入HTML文件专栏收录该内容

1 篇文章 1 订阅

订阅专栏

昨天学的导入HTML数据来记录一下，虽说暂时看不懂，但是却在CSDN找到更简单的导入方式，其实刚接触会发现很多代码啊，报错也是看不懂。但是我相信继续深入会慢慢越来越好的额。

代码如下：实现导入NBA球员薪资的导入在pycharm

import  pandas as pd
df=pd.DataFrame()
url_list=['http://www.espn.com/nba/salaries/_/seasontype/4']

for i in range(2,13):
    url='http://www.espn.com/nba/salaries/_/page/%s/seasontype/4'%i
    url_list.append(url)
    #遍历网页中的table标签读取网页表格数据
    for url in url_list:
     df=df.append(pd.read_html(url),ignore_index=True)
     #列表解析：遍历dataframe对象的第3列，以字符串$开头
     df=df[[x.startswith('$')for x in df[3]]]
     print(df)
     df.to_csv(r'D:\Pycode\NBA.csv',header=['RK','NAME','TEAM','SALARY'],index=False)
     #导出csv文件

效果展示：

然后我说下我在百度上找到的，同样是CSDN大神写的代码，主要实现的功能是导入虎扑网站的积分排行榜：

下面直接上代码

import pandas as pd
url = "https://nba.hupu.com/standings"
res = pd.read_html(url)
print(res)

展示效果：

虽说如果说去读取其他的网页后就报错了，但是还是感觉非常神奇了，希望后面能的学习能学到跟更多东西

最后喜欢学Python的朋友可以给我点个收藏点个赞哦！，谢谢了！

慕白啊。

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录