自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 python中合并字典的一个小技巧

今天看到了一个python中合并字典的小技巧,特此记录。直接上代码:dict_1 = {'a': 1, 'b': 2}dict_2 = {'b': 4, 'c': 3}dict_3 = {**dict_1, **dict_2}合并dict_1和dict_2,生成dict_3。dict_3的结果为:{'a': 1, 'b': 4, 'c': 3}可以看到,两个星号"**"起到了合并字典的作用,合并后若有重复的key,新的key的value会覆盖旧的value。...

2020-10-25 14:44:56 158

原创 多进程concurrent.futures的ProcessPoolExecutor的一个注意点

多进程concurrent.futures的ProcessPoolExecutor需要在"if name == main"下运行,否则会报错。示例如下:from concurrent.futures import ProcessPoolExecutor, as_completedimport timenums = [30, 31, 32, 33, 34, 35, 36, 37]def fib(n): if n <= 2: return 1 return f

2020-10-24 16:41:46 6453 1

原创 python的requests-html库中使用render()后输出内容乱码的问题

近日在练习使用requests-html库来编写爬虫,不得不说这个库确实挺好用,里面的render()功能可以用来运行html文档中的JavaScript,在爬取带有JavaScript的网页时很方便,但在使用时发现一个问题,当网页内容里包含中文,且网页本身的charset不是utf-8,而是gbk等其他字符集的时候,render()后的网页中的中文会显示乱码,网上查阅了一些资料也没能解决这个问题。话说目前网上关于requests-html库的文章还是比较少,最后还是决定自己啃源码来解决这个问题。以下的

2020-09-20 16:05:40 3300 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除