问题参考
python如何去掉字符串‘\xa0’
Python split()方法
Python join()方法
python中join()函数的使用方法
问题背景
使用python对百度网页进行爬取时,爬取的摘要标签中,时间和文章内容在同一标签下,但属于同一标签,抓取的数据本身如果有空格,在编译的时候会输出字符\xa0 ,使用join和split的组合方法去掉
想要爬取目标数据:
使用beautifulsoup的select方法爬取出来的效果如下:
python如何去掉字符串‘\xa0’
Python split()方法
Python join()方法
python中join()函数的使用方法
使用python对百度网页进行爬取时,爬取的摘要标签中,时间和文章内容在同一标签下,但属于同一标签,抓取的数据本身如果有空格,在编译的时候会输出字符\xa0 ,使用join和split的组合方法去掉
想要爬取目标数据:
使用beautifulsoup的select方法爬取出来的效果如下: