Python 导入HTML网页数据

昨天学的导入HTML数据来记录一下,虽说暂时看不懂,但是却在CSDN找到更简单的导入方式,其实刚接触会发现很多代码啊,报错也是看不懂。但是我相信继续深入会慢慢越来越好的额。

代码如下:实现导入NBA球员薪资的导入在pycharm

import  pandas as pd
df=pd.DataFrame()
url_list=['http://www.espn.com/nba/salaries/_/seasontype/4']

for i in range(2,13):
    url='http://www.espn.com/nba/salaries/_/page/%s/seasontype/4'%i
    url_list.append(url)
    #遍历网页中的table标签读取网页表格数据
    for url in url_list:
     df=df.append(pd.read_html(url),ignore_index=True)
     #列表解析:遍历dataframe对象的第3列,以字符串$开头
     df=df[[x.startswith('$')for x in df[3]]]
     print(df)
     df.to_csv(r'D:\Pycode\NBA.csv',header=['RK','NAME','TEAM','SALARY'],index=False)
     #导出csv文件

效果展示:

然后我说下我在百度上找到的,同样是CSDN大神写的代码,主要实现的功能是导入虎扑网站的积分排行榜:

下面直接上代码

import pandas as pd
url = "https://nba.hupu.com/standings"
res = pd.read_html(url)
print(res)

展示效果:

虽说如果说去读取其他的网页后就报错了,但是还是感觉非常神奇了,希望后面能的学习能学到跟更多东西

最后喜欢学Python的朋友可以给我点个收藏点个赞哦!,谢谢了!

 

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值