爬虫
YuG819
这个作者很懒,什么都没留下…
展开
-
正则表达式不得不知道的re用法
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。 re 模块也提供了与这些方法功能完...原创 2020-03-13 13:58:33 · 269 阅读 · 0 评论 -
selenium自动化测试工具的爬虫之旅
Selenium是一个自动化测试工具,可以驱动浏览器器执行特定的动作,如点击,下拉等。同时还可以获取浏览器当前呈现页面的源代码,可见即可爬。 浏览器驱动 根据自己的浏览器进行选择: Chrome Firefox 使用selenium写爬虫 优势 * 不需要做复杂的抓包、构造请求、解析数据等,开发难度相对要低一些。 * 其访问参数跟使用浏览器的正常用户一模一样,访问行为也相对更像正常...原创 2020-03-11 14:19:17 · 397 阅读 · 0 评论