![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
日常开发问题
书剑豪侠
这个作者很懒,什么都没留下…
展开
-
解决同花顺导出Excel文件无法读取的问题xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record;
同花顺问财有个数据数据导出的功能,可以导出为Excel 格式,但是用Python直接读取的时候会报错,如下图: file_name = datetime.now().strftime("%Y-%m-%d") path = "C:/Users/Administrator/Downloads/%s.xls" % file_name df = pd.read_excel(path) print(df) 会直接报错 xlrd.biffh.XLRDError: Unsupported format, or c.原创 2021-06-27 18:18:13 · 6135 阅读 · 1 评论 -
如何用python实现scrapy定时执行爬虫任务
最近老是给boss报告财务数据,每天都是重复性的工作,于是针对scrapy写了一个定时爬虫的程序main.py ,直接放在scrapy的存储代码的目录中就能设定时间定时多次执行。 直接使用Timer类 import time import os while True: os.system("scrapy crawl '你的爬虫名字'") time.sleep...原创 2019-11-09 15:32:38 · 535 阅读 · 0 评论 -
scrapy框架爬虫利用selenium控制浏览器,实现自动登录和退出
一、控制浏览器的方法 本文主要是讲如何通过selenium来实现自动登录获取cooikes,自动退出浏览器 from selenium import webdriver browser = webdriver.Firefox(executable_path="######您的浏览器路径#####geckodriver.exe") # 等待3秒,用于等待浏览器启动完成,否则可能报...原创 2019-11-09 15:05:24 · 679 阅读 · 0 评论 -
解决"'pip' 不是内部或外部命令,也不是可运行的程序或批处理文件"的问题
主要是路径的问题,把script所在路径添加的PATH(电脑–属性—高级系统设置–坏境变量),注意下你的scripts一定要有pip3.exe,不然无效原创 2019-10-25 21:46:08 · 660 阅读 · 0 评论