在学习爬虫的时候当时看到一个很奇怪的例子:
原网页是<li deg courseid="123" stop="1">.......</li>这样的
但是我发现教程中的正则表达式直接用的是
re.findall('(<li deg="".*?</li>)',source,re.S)来匹配,
当时看到deg属性中没有具体的值而是直接"",就很不解,然后询问了之后如下:
当然后来发现其实怎么匹配还是以真实的requests.get(url)得到的内容为主。这个才是最主要的
在学习爬虫的时候当时看到一个很奇怪的例子:
原网页是<li deg courseid="123" stop="1">.......</li>这样的
但是我发现教程中的正则表达式直接用的是
re.findall('(<li deg="".*?</li>)',source,re.S)来匹配,
当时看到deg属性中没有具体的值而是直接"",就很不解,然后询问了之后如下:
当然后来发现其实怎么匹配还是以真实的requests.get(url)得到的内容为主。这个才是最主要的