python爬取网页小说去除nbsp_html的空格和&nbsp怎么去除?

同楼主,这个问题我也碰到了。

用html_parser好像不也行

bVQJue?w=1110&h=324

replace也不解决不完全,我希望把所有数据(房间类型,面积,位置,详细位置,发布时间,价格)放一行

bVQJuY?w=1061&h=414

最后没办法只能这样了

import requests ##导入requests

from bs4 import BeautifulSoup ##导入bs4中的BeautifulSoup

res = requests.get('http://sz.58.com/nanshan/zufang/0/j2/?minprice=0_1600&PGTID=0d300008-0071-367d-7e8f-38bb92b6eebc&ClickID=2')

res.encoding='utf-8'

soup=BeautifulSoup(res.text,'html.parser')

for info in soup.select('li'):

a=info.select('.des .room')[0].text.replace(" ","")

b=info.select('.des .add')[0].text.replace(" ","")

c=info.select('.listliright .sendTime')[0].text.replace(" ","")

d=info.select('.listliright .money')[0].text

print(a,b,c,d)

print(".....................................................")

bVQJyz?w=864&h=300

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值