python爬虫
文章平均质量分 65
爬虫
Neo_21
多喝热水.jpg
展开
-
正则表达式re
【代码】正则表达式re。原创 2023-04-22 22:55:12 · 171 阅读 · 0 评论 -
Scrapy配置使用
注意:是不是powershell,两者还是有区别的。因为是本地的虚拟环境,用cmd激活环境并且安装相关的scrapy包,如果用powershell,在pycharm中显示不了安装的包。原创 2023-04-20 21:07:24 · 605 阅读 · 0 评论 -
python爬虫简介
使用python编写的爬虫脚本(程序)可以完成,指定目标(Web站点)的数据爬取,主要使用多(单)线程/进程,网络请求库,数据解析,数据存储,任务调度等相关技术。可以完成接口测试,功能性测试,性能测试和集成测试。原创 2023-04-19 00:01:47 · 914 阅读 · 1 评论 -
Python3.7安装与Django的配置
毕业设计有个问题想用3.7试一下。原创 2023-04-16 12:47:13 · 210 阅读 · 0 评论 -
编码与解码
字符集编码参考:讲的很好啊ovo字符集编码0 1(高低电平) => 101010101 => 二级制转化为十进制如何进行存储文字信息:类似与摩斯密码。原创 2022-11-28 22:49:00 · 91 阅读 · 0 评论 -
爬虫re&urllib
标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。匹配成功re.match方法返回一个匹配的对象,否则返回None。re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库。在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境。: 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。原创 2022-11-24 20:43:30 · 107 阅读 · 0 评论