python爬虫
爬虫学习
卫生纸不够用
这个作者很懒,什么都没留下…
展开
-
xpath语法
https://blog.csdn.net/Hogwartstester/article/details/137103140https://blog.csdn.net/weixin_43865008/article/details/115332404https://www.runoob.com/xpath/xpath-syntax.html原创 2024-07-28 04:02:46 · 132 阅读 · 0 评论 -
lxml.etree模式使用(一)
【代码】python-lxml.etree-(一)-ElementClass。原创 2024-07-28 02:29:46 · 241 阅读 · 0 评论 -
bs4模块使用(三)
过滤器可以为bs对象提供的搜索API的参数提供更好的描述。不在搜索内置的参数名。原创 2024-07-25 21:25:56 · 225 阅读 · 0 评论 -
https建链过程
参考文章博客园求支持。原创 2024-07-25 20:49:03 · 101 阅读 · 0 评论 -
bs4模块使用(二)
通过 .next_siblings 和 .previous_siblings 属性可以对当前节点的兄弟节点迭代输出。想要获取节点,最简单的方法就是提供tag名字,甚至可以在文档树的tag中多次调用这个方法。.contents和.children属性获取的子节点,仅包含tag的直接子节点。通过点取属性的方式只能获得当前名字的第一个tag,后面会介绍获取全部。一个Tag可能包含多个字符串或其它的Tag,这些都是这个Tag的。使用该属性,不需要对直接子节点的子节点进行二次数据提取。属性来获取某个元素的父节点。原创 2024-07-21 22:16:08 · 324 阅读 · 0 评论 -
bs4模块使用(一)
BeautifulSoup 对象表示的是一个文档的全部内容,BeautifulSoup 对象并不是真正的HTML或XML的tag,没有name和attribute属性。,否则就算Beautiful Soup已方法已经执行结束,该对象的输出也会带有对象的引用地址.这样会浪费内存.NavigableString 存在许多子类,不用适用于解析xml文件。对于tag对象的属性操作,和操作字典一样。后面再详细介绍,先介绍最重要的两个属性。原创 2024-07-21 20:04:49 · 260 阅读 · 0 评论 -
python-re模块使用
https://www.cnblogs.com/CYHISTW/p/11363209.html转载 2024-07-21 18:43:38 · 22 阅读 · 0 评论 -
TCP系列(一)-介绍TCP
TCP和UDP同样使用IP提供的服务,但是TCP提供的是面向连接,可靠的字节流服务面向连接使用TCP进行通信双方,必须先建立连接,然后进行数据交换可靠服务报文段字节流TCP不会修改任何数据内容。原创 2024-07-18 22:36:39 · 570 阅读 · 0 评论