工作日志
JS_WONG
这个作者很懒,什么都没留下…
展开
-
Python爬虫初步探索
朋友有个爬数据填表的需求,想让我实现一下,正好Python在爬虫上应用广泛,我也可以藉此练练手。 2020年的第一天,开工。 小目标:每日定时爬取某网页中一个表格中指定数据。 早上,先了解了各种爬虫技术(其实就是第三方库)的差异、优缺点,发现功能上基本类似或者有交集。 其中一篇文章说到Scrapy适用于大项目,Requests使用于小项目,暂时作参考吧,先用着Requests。 在查阅资料过程中,...原创 2020-01-02 00:57:21 · 272 阅读 · 1 评论 -
Linux命令行中一个空格引起的错误
今天在JupyterNoteBook中编写获取数据工具,过程中调用Linux命令来进行数据文件的压缩、删除等操作。 其中部分代码如下: cresym = 'Result2' filename = cresym + '.csv' tarfilename = cresym + '.tar.gz' !tar -zcvf {tarfilename}{filename} # 或者两句合一句:!tar -...原创 2019-12-31 17:01:53 · 859 阅读 · 0 评论