爬虫总结
爬虫的一系列注意事项
努力学习各种软件
被各种软件折磨的研一狗
展开
-
爬虫的一些小技巧总结
若通过参数找不到就直接搜索m3u8。原创 2024-02-28 14:53:35 · 1008 阅读 · 0 评论 -
Pycharm中的光标
Pycharm中的光标变成小白方框的时候,按insert键即可恢复竖线形式。原创 2023-12-10 11:15:29 · 997 阅读 · 1 评论 -
Python正则的匹配与替换
查找时的注意事项,要查找的内容左右两边打出来,用真正的字符,不要用.*?c = '"as"/\aksjlaacontent="我是你爸爸",assdad/'"as"我好快乐 ksjlaacontent="我是你爸爸",assdad我好快乐。"啦啦"/ 啦啦啦啦啦啦啦啦啦啦啦啦啦="我是你爸爸",啦啦啦啦啦啦/匹配的结果为括号中的内容,其他的不会呈现(.*?g = re.sub('[/]','我好快乐',c)h = re.sub('[a-z]','啦',c)这里也必须要中括号,把所有的字母替换为啦。原创 2023-12-31 12:17:15 · 714 阅读 · 0 评论 -
Python中对字符串的处理函数
分割后是一个列表:['ahbc', 'j89012?d = a.replace('我是你爹','嗨')b = 'ahbc,j89012?结果:ahbc,j89012?取列表的后一个元素:j89012?结果为:ahbcj89012我是你爹。结果为:ahbc,j89012?用join函数是迭代拼接。原创 2023-12-29 14:58:01 · 429 阅读 · 1 评论 -
python中parsel模块的css解析
div.content li:nth-child(1)::attr(href)返回的是class = 'content'的整个div标签下的li标签中的第一个li标签,其中的href所对应的属性值。div.content li:nth-child(1)::text返回的是class = 'content'的整个div标签下的li标签中的第一个li标签中的文本数据。div.content li:nth-child(1)返回的是class = 'content'的整个div标签下的li标签中的第一个li标签。原创 2024-01-06 19:43:01 · 1330 阅读 · 0 评论 -
谷歌浏览器抓包工具network下没有all xhr 等怎么办
点击最右上角的螺丝钉(设置按钮)下滑点击重新恢复默认设置即可。原创 2024-01-01 16:48:50 · 1776 阅读 · 0 评论 -
python中random模块的简单学习
【代码】python中random模块的简单学习。原创 2024-01-08 14:41:25 · 420 阅读 · 0 评论 -
Python爬取时出现Connection broken: IncompleteRead(2097152 bytes read, 22699640 more expected)错误怎么办
【python requests接收chunked编码问题 - CSDN App】http://t.csdnimg.cn/VJpwQ。接上篇爬取糖豆视频,错误并不是被禁止链接,而是上述错误,有一个不是办法的办法,直接跳过错误,见上图。原创 2024-01-01 16:44:39 · 1572 阅读 · 0 评论 -
Python删除列表中的空元素, 元素
content = ['\n','\t','woshi','哈哈']a = ['p','我是你的','p','你是我的吗','p']结果为:['woshi', '哈哈']原创 2023-12-29 15:23:59 · 358 阅读 · 0 评论 -
Python两个列表联合起来遍历
print(i,j)结果如下:1 a23 b4 c2 d23 e2 f3 g1 h。原创 2023-12-29 16:18:59 · 360 阅读 · 0 评论 -
编码和解码问题
上面这种以 b 开头的就是字节码,一个斜杠就是一个字节。可见,一个常用汉字用 GBK 格式编码后占 2 个字节,用 UTF-8 格式编码后占 3 个字节。然后在进行解密之后一般还是utf-8格式储存的,再.decode('utf-8')转为我们人能认识的unicode字符串形式。解码 / decode:将特定编码格式的字节码转换为对应的 Unicode 字符串的过程。原创 2024-02-24 14:38:44 · 458 阅读 · 0 评论 -
js逆向基础必备知识一
v1 = 11 ===(n=123) 先把123赋值给n,再判断l1与n是否相等,最后把false赋值给v1。三个等于号表示是否完全相等,==则不然,若1=="1"会报正确。v4 = 0||15||"杨鑫" 0||15先弄,整体取决于15,相当于15||"杨鑫",v4结果为15。let str = Buffer.from("密文","base64").toString();sign.call(123,456,888)执行结果为456,888,函数内部this=123。原创 2024-02-23 16:27:45 · 1128 阅读 · 0 评论 -
Rstudio下载包总失败的处理方法
1.在R-studio中下载包总失败,可以在R中点击程序包-安装程序包-选择镜像地址(一般选择中国北京的)-之后查找需要的包-点击即可-回到R-studio中在右下角点击packages-找到你要的包打上勾即可-在命令窗口使用library调用。即可,也可以选择excel,看自己的数据是什么格式,按对应按键即可。5.Rstudio设置黑色界面-点击Tools-点击Global options-点击appearance-在Editor theme点击第一个选项-点击apply即可。R-studio小知识。原创 2023-09-28 19:04:04 · 2066 阅读 · 0 评论 -
电脑小知识
6.卸载程序要先停用,再删除program files 在删除 program Files(x86) 在删除program data。又点击此电脑-管理-磁盘管理-右点击C盘-点击压缩卷-输入压缩空间量-压缩-然后点击下一步。后者被隐藏如何显现:点击盘-查看-点击隐藏的项目就可以看见programdata。又点击此电脑-属性-高级系统设置-环境变量-path可以增加或删改环境变量。3.又点击此电脑-管理-服务和应用程序-服务-可以对程序进行停用。文件夹的隐藏:又点击-属性-常规-隐藏-应用。原创 2023-09-28 19:00:41 · 47 阅读 · 0 评论 -
Linux下载centos7,如何完整解压
很多人下载centos7后都面临解压后文件一堆,无用的情况,下面教你操作。下载好文件后,又点击打开----属性----将打开方式改为文件夹。点击确定,然后文件就变成这样了。原创 2023-12-04 17:35:52 · 388 阅读 · 0 评论