- 博客(6)
- 问答 (2)
- 收藏
- 关注
原创 使用jupyter运行multiprocessing多进程库的问题
在Jupyter Notebook自定义了函数,然后调用multiprocess库进行多进程处理,发现程序一直处于运行状态,不出结果也不结束,而在Pycharm中则正常运行,难道是.ipynb格式的自定义函数不支持多进程?Jupyter用于数据分析还是很好用很方便的,但是有些大文件的运行如果不支持多进程的话很费时间,比如量化回测等,这个问题需要解决。先把代码写进.py文件中,比如在Pycharm中写好后保存,然后在Jupyter Notebook中通过import导入就可以直接运行。这样就能正常运行了。
2023-09-22 10:19:04 1901 3
原创 大白话讲pd.offsets.CDay()
如果holidays的值和weekmask的值有重叠,默认不做处理。即把holidays设为“20200115”,默认情况下还是会输出20200115,并不会跳过。为周日,跳三个weekmask中的值就是从8号开始起跳第一个、第二个就是10号、第三个就是15号,即。解释:定制offset,可以指定weekmask和holidays参数(思考为什么三个都是一个值),同理20200106和20200107往前跳三个weekmask值得到的是同样的结果。里进行的,即跳过三个自定义的工作日。
2023-09-03 18:31:14 191
原创 评委打分例子更优雅的写法
从上面的方法来说,明显第三种方法更快,各种思路和操作也确实更能锻炼解题能力,但我觉得写法中太多的切片、取值、转换,看着头大,可读性不高。【方法二】没有上面的方法那么简洁,好在逻辑简单清晰,可读性高,小白一眼看下去也能知道在干嘛,运行速度也更快,只用0.127s。某比赛有1000名选手,300位评委打分,每个选手由三个不同的评委打分,每位评委打10位选手的分。【方法一】思维量较大,有技巧性,对Pandas依赖较少¶,耗时0.468秒。【方法一】耗时0.24秒,简洁的代码省下来很多敲码时间,且更具可读性。
2023-08-05 17:41:32 150
原创 利用Python进行爬虫时中途总会出错并中止运行,并提示multiprocessing.pool.RemoteTraceback,我把源代码全部贴出来,请大家帮帮忙,谢谢!
源代码:import requests # 爬取页面import logging # 输出信息import re # 正则表达式import pymongo # 存储数据from pyquery import PyQuery as pq # 直接解析网页from urllib.parse import urljoin # URL拼接import multiprocessinglogging.basicConfig(level=logging.INFO,
2020-07-07 03:06:21 3081 3
空空如也
请问这是什么问题,百度都找不到任何信息?
2022-02-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人