- 博客(3)
- 收藏
- 关注
原创 python中合并字典的一个小技巧
今天看到了一个python中合并字典的小技巧,特此记录。直接上代码:dict_1 = {'a': 1, 'b': 2}dict_2 = {'b': 4, 'c': 3}dict_3 = {**dict_1, **dict_2}合并dict_1和dict_2,生成dict_3。dict_3的结果为:{'a': 1, 'b': 4, 'c': 3}可以看到,两个星号"**"起到了合并字典的作用,合并后若有重复的key,新的key的value会覆盖旧的value。...
2020-10-25 14:44:56 158
原创 多进程concurrent.futures的ProcessPoolExecutor的一个注意点
多进程concurrent.futures的ProcessPoolExecutor需要在"if name == main"下运行,否则会报错。示例如下:from concurrent.futures import ProcessPoolExecutor, as_completedimport timenums = [30, 31, 32, 33, 34, 35, 36, 37]def fib(n): if n <= 2: return 1 return f
2020-10-24 16:41:46 6453 1
原创 python的requests-html库中使用render()后输出内容乱码的问题
近日在练习使用requests-html库来编写爬虫,不得不说这个库确实挺好用,里面的render()功能可以用来运行html文档中的JavaScript,在爬取带有JavaScript的网页时很方便,但在使用时发现一个问题,当网页内容里包含中文,且网页本身的charset不是utf-8,而是gbk等其他字符集的时候,render()后的网页中的中文会显示乱码,网上查阅了一些资料也没能解决这个问题。话说目前网上关于requests-html库的文章还是比较少,最后还是决定自己啃源码来解决这个问题。以下的
2020-09-20 16:05:40 3300 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人