python爬虫
每个爬虫代码都是全网独一份
坏孩子充电自习室
这个作者很懒,什么都没留下…
展开
-
Python pymysql 批量插入与批量更新数据库
添加链接描述原创 2022-01-05 10:02:46 · 983 阅读 · 0 评论 -
python使用requests库发送https请求报错:SSLCertVerificationError: [SSL: CERTIFICATE_VERIFY_FAILED]
添加链接描述原创 2021-10-18 21:27:16 · 1009 阅读 · 0 评论 -
ffmpeg实现添加和去除水印
ffmpeg添加水印ffmpeg去水印原创 2021-10-12 19:34:38 · 1016 阅读 · 0 评论 -
Python3设置了UTF-8文件还是保存为ANSI解决办法
Python3设置了UTF-8文件还是保存为ANSI解决办法原创 2021-10-05 08:39:08 · 774 阅读 · 0 评论 -
python如何获取指定文件夹下的文件列表
添加链接描述原创 2021-10-04 22:49:35 · 138 阅读 · 0 评论 -
python操作文件夹、文件大全
一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。1.得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()2.返回指定目录下的所有文件和目录名:os.listdir()3.函数用来删除一个文件:os.remove()4.删除多个目录:os.removedirs(r“c:\python”)5.检验给出的路径是否是一个文件:os.path.isfile()6.检验给出的路径是否是一个目录:os.path.isdir()7.判断是否是绝对原创 2021-10-04 22:44:34 · 615 阅读 · 0 评论 -
爬虫代码报错:Remote end closed connection without response
原因分析1.UA被识别为爬虫,封了,解决–> 设置cookie池import randomdef cookie_list(): USER_AGENTS = [ "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)", "Mozilla/4.0 (compatible; MS原创 2021-10-03 14:59:55 · 1381 阅读 · 2 评论 -
python全局变量的玩法
# 记录每个分类项出现空值的个数 def count_add(home,title): global null_cnt_dict global null_value_dict # 每调用一次函数就给相应的home加1 null_cnt_dict[home] = null_cnt_dict[home] + 1 # 空值的title添加进list null_value_dict[home].append(title) # 程序结束原创 2021-10-03 14:38:37 · 198 阅读 · 0 评论 -
python写入数据到csv中,头信息保证只写入一次
import csvimport codecswith codecs.open(filename,'a+','utf-8') as csvfp: # 指定csv文件的头部显示项 global flag_only_one if(flag_only_one): file_headers = ["标题","网盘地址","提取码","解压密码"] writer = cs.原创 2021-10-03 14:20:52 · 1920 阅读 · 0 评论