问题描述:
在抓取网页内容时,利用requests,bs4等均能在结果中看到我想要的某字段,但是使用pyquery提取时却没有了
检查后不是编码的问题(结果中有正常显示的汉字),也不是xhtml和html的问题
发现问题:
打开网页源代码,检索“尾页”,发现含有此字段的代码被注释了!!!
解决办法:
将被注释代码提取出来,再利用pyquery转化并提取,就可以了。
在抓取网页内容时,利用requests,bs4等均能在结果中看到我想要的某字段,但是使用pyquery提取时却没有了
检查后不是编码的问题(结果中有正常显示的汉字),也不是xhtml和html的问题
打开网页源代码,检索“尾页”,发现含有此字段的代码被注释了!!!
将被注释代码提取出来,再利用pyquery转化并提取,就可以了。