日常
Abbiesdiary
这个作者很懒,什么都没留下…
展开
-
静态网页爬虫
记小白的第一次爬虫经历。目标:爬取股吧论坛个股吧(每支股票)第一页帖子内容(股票代码、帖子url、帖子标题、帖子内容),并输出到csv文件爬虫框架:调度器class SpiderMain(object):创建四个对象(分别为url管理器对象,下载对象,解析对象,输出对象):爬虫函数def crawl(self, root_url):本段代码的主要逻辑很简单,就是从未爬取的url集合中取出一个一个u...原创 2018-07-14 19:59:36 · 902 阅读 · 0 评论 -
linux : Address already in use 解决方案
第一步:查询被占用端口号的进程netstat -apn | grep **** (****: 被占用端口号)获得进程pid, 即最后一列的数字第二步:确认进程 (可以跳过,非必须)ps -ef | grep **** (****: 第一步查询得到的pid)确认这个进程是不是你找的那个,第三步: 杀死该进程,释放被占用的端口号kill -9 **** (****: 第一步查询得到的pid)参考:https://blog.csdn.net/wzl_lzw/articl...原创 2021-02-17 09:47:19 · 488 阅读 · 0 评论 -
Linux 如何复制粘贴
方法一:复制:Ctrl + Shift + C粘贴:Ctrl + Shift + V方法二:(不知道为什么远程操作学校的计算机,无法使用方法一中的方法粘贴)粘贴:鼠标指到要粘贴的位置,点击鼠标右键。原创 2021-02-17 09:35:45 · 1273 阅读 · 0 评论 -
java访问控制符
同一个类中 同一个包中 不同包中的子类 不同包中的非子类 private Yes default Yes Yes protected ...原创 2021-01-29 16:18:47 · 52 阅读 · 0 评论 -
人在海外,仍无法使用Chrome的解决方式
文字版:进入浏览器,点击设置选择高级-系统,点击“打开代理设置”,在局域网(LAN)设置下,点击局域网设置,在“代理服务器”下,取消勾选“为LAN使用代理服务器”图片版:...原创 2019-10-25 23:27:44 · 3371 阅读 · 0 评论