最近在玩爬虫,遇到一个网址,里面的内容有个CDATA的数据,然后beautifulesoup就受挫了,但是正则又写不好,该怎么办呢?
查了下资料,找到了解析这种数据的方法
import requests from bs4 import BeautifulSoup,CData import re def get_Response(_url): temp_response=requests.get(_url) #print(response.content.decode('utf-8')) temp_response.encoding='utf-8'