- 博客(1)
- 收藏
- 关注
原创 爬取实习僧网站并存储到MongoDB
爬取实习僧网站并存储到MongoDB,菜鸟之作爬取思路: 分析网页结构:我们在搜索栏中输入python(其他都可以),我们会发现 每个页面有10个工作岗位。 右键选择查看网页源代码,找到相应的job列表位置,但是结果是崩溃的,,这是什么鬼东西,即使能爬下来,但是我们看不懂,于是我换了一种思路。 直接找到每一个job的页面,比如,这里就要用到正则表达式(我的最爱)正则不会的点这里,然后
2017-09-21 18:37:40
803
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人