自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 解决同花顺导出Excel文件无法读取的问题xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record;

同花顺问财有个数据数据导出的功能,可以导出为Excel 格式,但是用Python直接读取的时候会报错,如下图:file_name = datetime.now().strftime("%Y-%m-%d")path = "C:/Users/Administrator/Downloads/%s.xls" % file_namedf = pd.read_excel(path)print(df)会直接报错xlrd.biffh.XLRDError: Unsupported format, or c.

2021-06-27 18:18:13 6151 1

原创 如何用python实现scrapy定时执行爬虫任务

最近老是给boss报告财务数据,每天都是重复性的工作,于是针对scrapy写了一个定时爬虫的程序main.py ,直接放在scrapy的存储代码的目录中就能设定时间定时多次执行。 直接使用Timer类import timeimport os while True: os.system("scrapy crawl '你的爬虫名字'") time.sleep...

2019-11-09 15:32:38 535

原创 scrapy框架爬虫利用selenium控制浏览器,实现自动登录和退出

一、控制浏览器的方法本文主要是讲如何通过selenium来实现自动登录获取cooikes,自动退出浏览器from selenium import webdriverbrowser = webdriver.Firefox(executable_path="######您的浏览器路径#####geckodriver.exe") # 等待3秒,用于等待浏览器启动完成,否则可能报...

2019-11-09 15:05:24 683

原创 解决"'pip' 不是内部或外部命令,也不是可运行的程序或批处理文件"的问题

主要是路径的问题,把script所在路径添加的PATH(电脑–属性—高级系统设置–坏境变量),注意下你的scripts一定要有pip3.exe,不然无效

2019-10-25 21:46:08 660

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除