目录
爬虫案例
1.获取目标资源 http.get
2.分析网站内容 使用cheerio插件 可以使用jq里的各种选择器
3.获取有效信息 下载或进行其他操作
若爬取到的数据不能用,需要修改一下例如加上协议https:
$在jq中的用法
1.获得对象内容 .text()
<span id='myspan'>这是测试内容</span>
<button onClick='getobj()'>获得对象内容</button>
<script>
function getobj(){
var neirong=$('#myspan').text();
alert(neirong);
}
</script>
2.$(选择器).attr(属性名)获取指定元素的指定属性的值
$('img').attr('src')
3.$(选择器).each() 循环一个选择器
$('img').each((index,el)=>{
// console.log(el);
console.log($(el).attr('src'))
})
使用$之前需要进行转化:即将一个html格式的字符串转化为类dom之后,可以通过jq的语法选中其中的元素
let $=cheerio.load('<div><p>你好<p><img src="http://www.baidu.com"><img src="http://www.baidu111.com"><div>');