自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 R语言导入txt文本报错:more columns than column names(列的数目比列的名字要多)问题解决

R语言导入txt文本报错:more columns than column names(列的数目比列的名字要多)问题解决mergedata <- do.call("rbind", lapply(dir, function(x){ data = read.table(x,sep = "|",

2021-04-07 09:54:34 11148 4

原创 python导入数据库报错:ORA-00054: 资源正忙, 但指定以 NOWAIT 方式获取资源, 或者超时失效---问题解决

python导入数据库报错:ORA-00054: 资源正忙, 但指定以 NOWAIT 方式获取资源, 或者超时失效—问题解决今天在对爬虫入库的脚本进行修改时,突然报错:ORA-00054: 资源正忙, 但指定以 NOWAIT 方式获取资源, 或者超时失效,想到之前测试脚本有无问题时在oracle中将数据插入目标表后没有提交,导致该表处于被锁状态,所以报错,点击如图所示的提交按钮后(也可以直接运行commit;命令),重新运行爬虫,数据成功插入!oracle凡是涉及增删改一定要commit!切记!切记!

2021-03-18 17:20:30 213

原创 python tesseract selenium自动识别验证码登陆

文章目录前言一、下载安装tesserocr二、1.2.总结前言前期写得爬虫已经逐渐稳定,但是每次都是手动输入验证码,时间久了觉得麻烦,就想着自动识别验证码登陆,于是就开启了各种百度之路,磕磕碰碰,总算成功实现自动登陆,特次复盘此次验证码识别的全过程,以便大家参考。一、下载安装tesserocrtesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层PythonAPI封装,所以它的核心是tesseract。所以需要先安装tesseract。下载链接:https

2021-01-28 18:29:35 906

原创 python selenium 删除chromedriver.exe提示被占用问题解决

python selenium 替换chromedriver.exe提示被占用问题解决今天由于谷歌浏览器莫名升级为最新版本,导致使用selenium爬虫时提示驱动chromedriver.exe与浏览器版本不一致,于是从http://npm.taobao.org/mirrors/chromedriver/88.0.4324.96/上下载了对应最新浏览器版本的驱动,打算替换旧的驱动,却提示被占用将pycharm关闭后还是不行,百度后:https://blog.csdn.net/weixin_39339

2021-01-28 11:24:57 1040

原创 python向oracle插入超过10万数据报错:DPI-1001: out of memory问题解决

python向oracle插入超过10万数据报错:DPI-1001: out of memory问题解决过程昨天在将爬虫数据入库时,突然报错DPI-1001: out of memory,小于10万条数据无问题,但之前并无此问题,仔细回想这中间有何差异,想到有可能是我将cx-Oracle库升级到最新版本8.1.0,于是特地将cx-Oracle删除,重新下载7.3.0版本,重新运行,顺利插入oracle数据库。感想本人习惯将库升级到最新版本,以为最新版功能更多更全,现在看来这并不是一个好习

2021-01-28 09:53:10 1804 1

原创 python selenium 通过标签文本定位

python selenium 通过标签文本定位背景今天在爬取历史数据时,需要选定特定日期,但是日期在不同行数会导致xpath路径不是递增的,是通过每7天增加1行来实现的,想要通过更改td[7]方括号里的数字来实现对应日期就不可能了,而且对于不同月份,1号所对应的星期也不一样,这就需要想办法构造或寻找其他规律来实现输入特定日期自动点击对应日期。3号://*[@id="ui-datepicker-div"]/table/tbody/tr[1]/td[7]/a10号://*[@id="ui-date

2021-01-21 18:06:09 2887

原创 oracle alter为表格增加一列,update不同条件下(case when)更新某列值

oracle alter为表格增加一列,update不同条件下(case when)更新某列值今天我的爬虫数据库表有了新的需求,需要在原表的基础上新增1列,只会基础查询的我果断百度起来,查到可以使用alter table table_name add area_city varchar2(255);commit;个人理解这段代码就是为表table_name,增加了列名为area_city的空列,这里的commit是我不知道alter命令会不会自动提交事务,保存更改,为了以防万一还是加上了。新的一

2021-01-07 18:30:51 1173

原创 解决python 使用time.loacltime()获取当前时间不准问题

解决python 使用time.loacltime()获取当前时间不准问题作为python小白的我,果然容易犯很多低级的错误或者说又不自觉想当然了,导致又花费了好长时间处理BUG。我在我的爬虫代码开始时记录了程序开始时间,代码如下:startTime = time.strftime("%Y-%m-%d %H:%m", time.localtime())相信大佬一眼就能看出我这段代码中存在的问题,但作为小白的我一开始对这个我对照着百度到的时间转化格式类推出来的代码自豪无比:time.strftim

2020-12-30 19:19:44 6972

原创 python爬虫页面按钮未加载报错selenium.common.exceptions.NoSuchElementException问题解决

python爬虫页面按钮未加载报错selenium.common.exceptions.NoSuchElementException问题解决前言在爬取公司内部网站数据时,是通过先生成下载任务,再切换至下载界面,点击下载按钮下载数据,简单来说,只是模拟人对浏览器的点击动作,进而将重复性工作自动化道路坎坷,bug出现昨天终于成功将爬取的数据插入数据库,并且在今天早上刚上班之际,发现昨天下班前还在执行的爬虫脚本完美的运行完毕,瞬间沾沾自喜,心想:“不错不错,总算可以稳定爬取数据了”,可当我喜滋滋的

2020-12-25 09:10:26 1786 1

原创 Oracle 用merge into 解决插入重复数据问题

Oracle 用merge into 解决插入重复数据问题继昨天解决用python向oralce插入数据问题,今天考虑到我插入的数据每次都是包含前一次插入的数据,太多重复值不利于之后的数据可视化,所以想着能不能插入数据的时候自动判别重复的值,只导入不重复的值,一开始用install into a where a.t not in (select t from a )结果报错,百度才知道install不能直接跟where,查询好久发现好多都指向用merge into,于是直接去搜了它的用法,感觉可行,就

2020-12-23 19:16:20 6781 2

原创 python 导入Oracle数据库报错TypeError: expecting string or bytes object解决

**python 导入Oracle数据库报错TypeError: expecting string or bytes object解决**第一次使用博客,之后打算开始记录当天python使用中学习到的新的知识点,今天在学习如何使用python将数据插入Oracle时,总是遇到ypeError: expecting string or bytes object这个错误,网上搜索了好多内容,关于这个错误的很少,之后经过各种尝试,初步猜测是导入的数据中字符类型有误,有一个博客说是空值nan的原因,于是用如下

2020-12-22 19:00:50 5120

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除