爬虫
文章平均质量分 95
且行且安~
擅长路径规划、车间调度、港口调度、排班调度等OR优化领域以及机器学习及数分领域,合作需求请见推广栏,请备注来意,不然不通过!
展开
-
Python-如何使用正则表达式
正则表达式是处理字符的强大工具,他有自己特定的语法结构,有了它,实现字符串的检索,替换,匹配验证都不在话下,不止如此,正则表达式可以从HTML中非常方便地提取想要的信息原创 2023-07-27 10:23:13 · 1209 阅读 · 0 评论 -
正则表达式的实践及自己的理解
这篇文章是在自己爬取51job时遇到了问题后,经过一定实践后得出的结论,由于自己是新手,卡克了很久后,突然恍然大悟,觉得非常有必要提醒自己,所以才写下了正则的一些案例。1 正则几个基本概念:见链接:http://www.runoob.com/regexp/regexp-example.html2 自己的实际操作中遇到的问题如图需要爬取这5项数据,具体的做法是复制了源码,在这里也...原创 2018-07-08 23:34:14 · 283 阅读 · 0 评论 -
urllib及re模块爬取51job的职位信息
https://search.51job.com/list/060000,000000,0000,00,9,99,python,2,3.html?lang=c&stype=1&postchannel=0000&workyear=99&cotype=99&degreefrom=99&jobterm=99&companysize=99&...原创 2018-07-09 23:50:16 · 783 阅读 · 0 评论 -
beautiful爬取豆瓣信息
我简要说下,我这里的问题,有几处错误,使得自己始终获取不到数据。beautifulsoup的文档http://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/1.属性后面是用键值对修饰的moviesol = soup.find('ol',attrs = {'class':"grid_view"})movieLi = moviesol.find_all('li'...原创 2018-07-12 17:31:58 · 330 阅读 · 0 评论