自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 问答 (1)
  • 收藏
  • 关注

原创 Python-Scrapy框架Debug模式错误记录

scrapy debugger

2024-04-18 14:53:10 207 1

原创 【Win环境】Python 使用 ConfigParser 三方库报错以及解决记录

获取配置参数的时候出现 GBK 编码错误:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 30: illegal multibyte sequence。这同样可以解决问题:configparser.MissingSectionHeaderError: File contains no section headers。检查文件配置路径是否有误即可。使用其他编码格式即可。

2023-04-11 11:16:48 556

原创 Mysql-Python-字段压缩

MYSQL-PYTHON-字段压缩

2022-07-12 15:31:35 871 2

原创 开发小记:Linux 实用技巧

Linux使用技巧

2022-06-28 10:45:36 283

原创 【学习小记1】Python mitmproxy 监控浏览器

mitmproxy

2022-04-13 20:02:05 1187

原创 【初学者小记】Python 随机 UA

Python UserAgent

2022-03-16 11:02:00 1839 2

原创 python小记: 往列表插入字典,却总被覆盖问题

今天就做了一个很蠢的事情,本来想吧 redis 中存储的列表转到 mysql 里去,结果测试程序的时候才发现不对,查数据库发现全是重复数据(特殊条件,ID 唯一且自增)最后 debug 才发现是 Python list 没理解透彻举栗子:listA = []a = {"a":1,"b":2}listA.append(a)a["a"] = 3a["b"] = 4listA.append(a)print(listA)# 结果为 [{{"a":3,"b":4}},{"a":3,"b":4}]

2021-11-12 14:28:43 1576 1

原创 Linux python3.7 安装 frida 所遇到的问题

环境:linuxpython3.7安装顺序:pip3 install frida结果在这里卡住了,没有截图,拿个网图给大家看看报错原因:这一点是因为SSL证书问题,它下载不了它的蛋蛋(或者是找不到),也就是 frida-15.1.10-py3.7-linux-x86_64.egg尝试过:easy_install frida-15.1.10-py3.7-linux-x86_64.egg结果卡在了 easy_install ,这东西没有,索性去下载 ez_setup.py 然后

2021-11-08 14:48:59 3298 1

原创 笔记2:windows 安装python包 -- fasttext

windows 安装 fastext 报错如下:解决方案:下载网址点击这里一、下载对应自己电脑版本的 fasttext 的 whl 文件,其中 cp代表python版本,amd64代表电脑位数。二、将下载好的文件,放入python文件夹的Script中三、在Script文件夹下cmd命令,pip install fasttext‑0.9.2***‑cp38‑cp38***‑win_amd64.whl,加粗部分请注意自己的版本。...

2021-08-06 09:53:50 615

原创 笔记:关于scrapy中post请求返回不到自己想要的元素

笔记:今天在使用scrapy中,要爬取一个网站“台湾大学图书馆”,它是一个简单的post请求,我轻车熟路的就敲出来了代码(更改后):from typing import Unionimport scrapyclass TaiwangenSpider(scrapy.Spider): name = 'TaiwanGen' allowed_domains = ['ebooks.lib.ntu.edu.tw'] # start_urls = ['http://ebooks.li

2021-03-26 17:51:05 165

原创 笔记:关于requests库下载txt报错

使用requests库下载txt文件的时候报错:Traceback (most recent call last): File "D:/ALL_workspace/pycharm/Code/TaiwanSpider/text.py", line 8, in <module> f.write(r.text)UnicodeEncodeError: 'gbk' codec can't encode character '\ufeff' in position 0: illegal mu

2021-03-24 18:07:06 250

原创 关于python匹配字符串中url的正则

最近爬虫爬取了一些标签里的href文本,里面什么都有,也有我要的跳转链接。但是正则匹配没学好,只能百度,百度的结果又不是很令人满意。废话不多说,百度结果如下:import repattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+') # 匹配模式string = "href='javascript:sendProblemForm('19

2021-03-24 11:54:04 1365 2

原创 500 Internal Privoxy Error

500 Internal Privoxy Error最近使用VPN打开国外网站看稀奇古怪的时候,就是打不开网站!但是我把VPN的全局模式关了又可以了,只是地址显示China,说实话不打紧的,但难免会去做爬虫小玩意儿。那可不行了。接下来我不管怎么尝试链接网站都显示www.xxxx.com意外终止了链接。我之后又检查了VPN发现地址端口都没问题,服务器也是正常运行状态。这就很奇怪。之后我重装了VPN再次打开网站显示如下:500 Internal Privoxy ErrorPrivoxy encounter

2021-01-07 13:46:19 576483

原创 关于selenium中text返回空值的原因

https://blog.csdn.net/qq_42804678/article/details/91345725?ops_request_misc=%25257B%252522request%25255Fid%252522%25253A%252522160826145016780277868650%252522%25252C%252522scm%252522%25253A%25252220140713.130102334.pc%25255Fall.%252522%25257D&request_id=16

2020-12-18 11:27:38 3926 4

原创 在使用Pyinstaller打包含有pandas的py文件所遇到的坑

https://github.com/pyinstaller/pyinstaller/issues/1580

2020-12-08 11:57:29 573683

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除