bs
hjhkkkl
这个作者很懒,什么都没留下…
展开
-
正则,xpath和BeactifulSoup三者区别
1.正则表达式是进行内容匹配,将符合要求的内容全部获取;xpath()能将字符串转化为标签,它会检测字符串内容是否为标签,但是不能检 测出内容是否为真的标签;Beautifulsoup是Python的一个第三方库,它的作用和 xpath 作用一样,都是用来解析html数据的相比之下, xpath的速度会快一点,因为xpath底层是用c来实现的 2.三者语法不同,正...原创 2018-08-08 17:45:30 · 2080 阅读 · 0 评论 -
Python:bs4中 string 属性和 text 属性的区别及背后的原理
刚开始接触 bs4 的时候,我也很迷茫,觉得 string 属性和 text 属性是一样的,不明白为什么要分成两个属性。html = '<p>hello world</p>'soup = BeautifulSoup(html, 'lxml')p = soup.pprint(p.string) # hello wordprint(p.text) # he...原创 2018-11-30 11:05:46 · 1158 阅读 · 0 评论