python Beautiful Soup lxml 兼容性好

from bs4 import BeautifulSoup
def commentslistbyindex(index):
     ss=requests.get("http://www.aigaogao.com/tools/history.html?s=300357").content
     soup = BeautifulSoup(ss,"lxml")
     tables = soup.findAll('table')
     tab=tables[-1]
     price =[]
     trs=tab.findAll('tr')
     print len(trs)
     trs.pop(0)
     trs.pop()
     for tr in trs:
      price.append(float(tr.findAll('td')[4].getText().encode("gb18030")))
      avg=sum(price)/len(price)
      strpr="%f,%f,%f,%f,%f\n" % (min(price),max(price),price[0],avg,avg/price[0])
     print soup.title
     print strpr

如果使用 html.parser 参数 得不到 table 表里的真正数据 lxml 兼容性好.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值