Python
文章平均质量分 75
Python
Amber.Li
这个作者很懒,什么都没留下…
展开
-
beautifulSoup 【HTML树解析库】基本知识
子孙节点的迭代类型,包含所有子孙节点,用于遍历循环【当前节点后续所有节点】儿子节点列表,其中‘\n’换行也作为列表的一个元素【当前节点下一层】与.contents类似,用于遍历儿子节点【当前节点下一层】最好的容错性以浏览器的方式解析文档生成HTML5格式的文档。tag中最重要的属性: name和attributes。tag中最重要的属性: name和attributes。, 因为那些Python版本的标准库中内置的。当前节点的下面的所有兄弟节点。当前节点的上面的所有兄弟节点。当前节点的下一个兄弟节点。原创 2023-03-15 14:40:24 · 399 阅读 · 0 评论 -
Robots协议 :Robots Exclusion Standard(网络爬虫排除标准)
说明Robots协议全称(网络爬虫排除标准)作用网站告知网路爬虫哪些页面可以抓取,哪些不行【类人行为,可以不遵守】形式网站根目录下放置robots.txt文件使用自动或人工识别robots.txt文件,再进行内容爬取约束性Robots协议是建议性非约束性,可以不遵守,但存在法律风险。原创 2023-03-15 09:45:18 · 905 阅读 · 0 评论 -
Python中的Requests库
Python Requests库原创 2023-03-14 15:33:06 · 364 阅读 · 0 评论