- 博客(3)
- 收藏
- 关注
原创 python中合并字典的一个小技巧
今天看到了一个python中合并字典的小技巧,特此记录。 直接上代码: dict_1 = {'a': 1, 'b': 2} dict_2 = {'b': 4, 'c': 3} dict_3 = {**dict_1, **dict_2} 合并dict_1和dict_2,生成dict_3。 dict_3的结果为: {'a': 1, 'b': 4, 'c': 3} 可以看到,两个星号"**"起到了合并字典的作用,合并后若有重复的key,新的key的value会覆盖旧的value。 ...
2020-10-25 14:44:56
172
原创 多进程concurrent.futures的ProcessPoolExecutor的一个注意点
多进程concurrent.futures的ProcessPoolExecutor需要在"if name == main"下运行,否则会报错。示例如下: from concurrent.futures import ProcessPoolExecutor, as_completed import time nums = [30, 31, 32, 33, 34, 35, 36, 37] def fib(n): if n <= 2: return 1 return f
2020-10-24 16:41:46
6481
1
原创 python的requests-html库中使用render()后输出内容乱码的问题
近日在练习使用requests-html库来编写爬虫,不得不说这个库确实挺好用,里面的render()功能可以用来运行html文档中的JavaScript,在爬取带有JavaScript的网页时很方便,但在使用时发现一个问题,当网页内容里包含中文,且网页本身的charset不是utf-8,而是gbk等其他字符集的时候,render()后的网页中的中文会显示乱码,网上查阅了一些资料也没能解决这个问题。 话说目前网上关于requests-html库的文章还是比较少,最后还是决定自己啃源码来解决这个问题。以下的
2020-09-20 16:05:40
3329
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人