- 博客(4)
- 收藏
- 关注
原创 解决同花顺导出Excel文件无法读取的问题xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record;
同花顺问财有个数据数据导出的功能,可以导出为Excel 格式,但是用Python直接读取的时候会报错,如下图:file_name = datetime.now().strftime("%Y-%m-%d")path = "C:/Users/Administrator/Downloads/%s.xls" % file_namedf = pd.read_excel(path)print(df)会直接报错xlrd.biffh.XLRDError: Unsupported format, or c.
2021-06-27 18:18:13
6151
1
原创 如何用python实现scrapy定时执行爬虫任务
最近老是给boss报告财务数据,每天都是重复性的工作,于是针对scrapy写了一个定时爬虫的程序main.py ,直接放在scrapy的存储代码的目录中就能设定时间定时多次执行。 直接使用Timer类import timeimport os while True: os.system("scrapy crawl '你的爬虫名字'") time.sleep...
2019-11-09 15:32:38
535
原创 scrapy框架爬虫利用selenium控制浏览器,实现自动登录和退出
一、控制浏览器的方法本文主要是讲如何通过selenium来实现自动登录获取cooikes,自动退出浏览器from selenium import webdriverbrowser = webdriver.Firefox(executable_path="######您的浏览器路径#####geckodriver.exe") # 等待3秒,用于等待浏览器启动完成,否则可能报...
2019-11-09 15:05:24
683
原创 解决"'pip' 不是内部或外部命令,也不是可运行的程序或批处理文件"的问题
主要是路径的问题,把script所在路径添加的PATH(电脑–属性—高级系统设置–坏境变量),注意下你的scripts一定要有pip3.exe,不然无效
2019-10-25 21:46:08
660
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人