最初做的是本硕博专业论文数据的采集,后来一直从事NLP工作。爬虫是重要的环节,生怕后来遗忘了,这里记录一下之前的编码项目,项目开源到了社区,需要的请移步GitHub查看,不做过多说明解释。
源码请参考Github地址:https://github.com/SimonWang00/weipu
注:本项目仅供学习交流使用,请勿做非法用途!
最初做的是本硕博专业论文数据的采集,后来一直从事NLP工作。爬虫是重要的环节,生怕后来遗忘了,这里记录一下之前的编码项目,项目开源到了社区,需要的请移步GitHub查看,不做过多说明解释。
源码请参考Github地址:https://github.com/SimonWang00/weipu
注:本项目仅供学习交流使用,请勿做非法用途!