python爬虫提取数据之Beautifulsoup4简单使用
实现原理遍历字符串,将文档树变成对象树,对象--属性--对象 结构
基本思路
创建对象转化
利用对象获取想要的数据
对象的属性
获取相应的标签,内容
优点,简单
缺点无法根据属性进行查找
对象的方法find_all(),select()两个方法功能相近,相比来说find_all功能更强大,因为text=的存在,且不能使用正则表达式查找
find_all()可以通过标签,属性,正则表达式查找,还能
原创
2017-12-04 10:14:35 ·
350 阅读 ·
0 评论