html取字段数字,使用BeautifulSoup从HTML中获取数字

我的问题是从数据文件中读取HTML,解析数据,提取数字并计算文件中数字的总和。在

这是密码from BeautifulSoup import *

import socket

mysock=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

mysock.connect(('python-data.dr-chuck.net',80))

mysock.send('GET http://python-data.dr-chuck.net/comments_42.html HTTP/1.0\n\n')

while True:

data = mysock.recv(512000)

if ( len(data) < 1 ) :

break

print data

mysock.close()

data2=BeautifulSoup(data)

tags=data2('a')

sum=0

for line in tags:

a=line.get('span',None)

sum+=int(a.text)

print sum

但我有以下错误

^{pr2}$

我不明白为什么我会得到错误,虽然我曾经错误地使用过http1.0,但它被提到了http1.1

请帮助我理解我的错误代码。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值