此次爬取网址:https://www.douyu.com/g_DNF
爬取内容:主播名字,主播热度

由于有两个相同的DyListCover_info信息,所以选取了DyListCover-hot这一行
作为正则的前缀界定
正则:
在爬取时内容时,发现爬取内容为空,于是我扩大了正则范围

然后将爬取的数据打印一条出来

发现<span class="DyListCover-hot"这多了个is-template.
在上面的正则上加上is-template就能成功爬取到数据了。

不是很懂web,希望大佬指教一下。
4232

被折叠的 条评论
为什么被折叠?



