- 博客(3)
- 收藏
- 关注
原创 知网爬虫复盘(爬取标题、作者等关键词并根据日期进行筛选)
文章目录一、前言二、思路分析1.访问知网主页2.跳转至高级检索页面并点击专业检索3.输入检索条件并检索4.依次爬取不同页面信息三、代码实现1.初始化检索条件2.调用search函数完成检索3.爬取当前页面信息4.翻页,等待下一次爬取5.存储数据四、源代码五、部分结果展示一、前言首先感谢一下作者Python伊甸园提供的思路:中国知网爬虫,本文也是基于高级检索进行筛选和相关信息的爬取,但在实际操作过程中发现知网的框架有所变化,所以在原代码的基础上进行了一些修改和针对性优化,此篇文章目的在于记录一些编写代码过
2021-01-24 16:54:28 5215 13
原创 vscode c++ 无法打开xxx 无法读取文件xxx
项目场景:vscode c++配置文件错误问题描述:最近换了下vscode下cpp的配置文件之后,在debug的时候,点击报错信息,就会弹出这么个框然后就没法定位错误信息,虽然根据报错信息后面的行数也不是不能调试,但还是比较麻烦。解决方案:在task.json里把"fileLocation": ["relative", "${workspaceRoot}"],改为"fileLocation": ["relative", "\\"],参考文章:https://www.zhihu.com
2020-10-27 12:53:30 3510
原创 Linux 由于/usr/bin 不在PATH 环境变量中,故无法找到该命令
最近在配置python环境变量的时候一不小心把PATH的值给重置了,然后就出现了这么个问题,在这里记录一下解决过程1.原因linux命令行执行命令时会遍历PATH中的路径寻找相同名称的可执行文件,当PATH被重新定义后就会无法找到。2.解决思路虽然没法直接执行类似vim,gedit,ls之类的命令,但是这个时候也可以用/usr/bin/xxx或者/usr/local/bin/xxx来直接调用相关命令,所以第一种解决思路sudo /usr/bin/vi ~/.bash...
2020-09-20 23:39:31 17072 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人