爬虫
刘娟娟❤PRESSone
这个作者很懒,什么都没留下…
展开
-
win10 设定计划任务时提示所指定的账户名称无效,如何解决?
我想把我的爬虫脚本设定为自动定时执行,我的设备是win10 操作系统,这用到系统自带的计划任务功能,且我希望不管用户是否登录都要运行该定时任务。但在设置计划任务的属性时,我遇到一个报错:所指定的账户名称无效。该报错是如何发生的,以及如何解决?记录如下:问题是怎么发生的?如下图所示,设置计划任务的属性:如果仅勾选“只在用户登录时运行”,点击“确定”后直接创建成功。并不会遇到如题报错。...原创 2019-09-11 11:51:44 · 20043 阅读 · 12 评论 -
pandas.to_sql()失败,遇到 pandas.io.sql.DatabaseError:1146 提示表格不存在的解决办法
在写我的爬虫脚本 csdn_my_article 时,遇到一处报错:pandas.io.sql.DatabaseError: Execution failed on sql ‘select * from csdn_my_article;’: (1146, “Table ‘zhihuclawer.csdn_my_article’ doesn’t exist”)相关的代码是:pd.io....原创 2019-09-11 14:54:00 · 8641 阅读 · 0 评论 -
用 python 写个小爬虫监控某人的 CSDN 文章数据
用 python / pandas + mysql 写了一个简单的小爬虫,用来爬取 我的 csdn 文章基本数据。python代码如下。如果不用 mysql,把文件读写的部分改成 pandas 的 read_csv / to_csv 也OK。如果想监控某大佬,或某一组 csdn id 的数据,也可以这么干。不过需要在此基础上简单加工下。如果想要持续采集数据,定时执行,可以用到操作系统自带的计划...原创 2019-09-11 15:18:32 · 280 阅读 · 1 评论 -
python 字符串替换功能 string.replace()可以用正则表达式,更优雅
说起来不怕人笑话,我今天才发现,python 中的字符串替换操作,也就是 string.replace() 是可以用正则表达式的。之前,我的代码写法如下,粗笨:自从发现了正则表达式也生效后,代码变得优雅简洁:备注:上图中的base_info 是 pandas 里的 dataframe 数据结构,可以用上述方法使用 string 的 replace 方法。...原创 2019-09-12 17:39:58 · 19839 阅读 · 3 评论