python抓取中科院大学招聘

原创 2016年08月30日 17:18:29

抓取最新招聘和系统招聘:

#coding=utf8
import urllib,sys
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding("utf-8")

def gethtml(url,pageid):
    page=urllib.urlopen('%s%d'%(url,pageid))
    html=page.read().decode('gbk')
    return BeautifulSoup(html,'html.parser')

def getitem(html):
    comlist=html.find(attrs={'class':'listborder'}).findAll('a')

    return [x['title'].encode() for x in comlist]

if __name__=="__main__":
    with open('com.txt','a') as f1:
        for i in range(1,87):
            html=gethtml('http://job.ucas.ac.cn/home/news/be59ab33-e946-48ed-a0eb-0d3e97b62870?page=',i)
            comlist=getitem(html)
            for i in comlist:
                f1.write(i+'\n')

    with open('sys.txt','a') as f2:
        for i in range(1,9):
            html=gethtml('http://job.ucas.ac.cn/home/news/56966245-bd19-43ca-bafe-404b4a4c57a5?page=',i)
            comlist=getitem(html)
            for i in comlist:
                f2.write(i+'\n')



基于python的中科院分词实现

  • 2013年03月05日 13:13
  • 2.87MB
  • 下载

用python抓取中北大学贴吧信息看热点

经过几天的学习已可以写出简单的爬虫了,无聊逛贴吧就实验一下, 一、明白你的目的是什么             我只是想看一下最近贴吧小萌新讨论什么在,反应讨论内容的就是标题了,因此我们要把他们的标题爬...

职场薪火用户画像之京东2017中科院校园招聘内推专场

多图预警,英吹思庭~~

[笔记]python网络爬虫:一个简单的定向爬取大学排名信息示例

爬取的网站信息网站地址 中国大学排行榜:http://www.eol.cn/html/ky/16phb/ 爬取内容 爬取该网站的综合排行榜单: 网页对应的源代码 ...

北京理工大学python

  • 2017年04月27日 18:59
  • 3.13MB
  • 下载

【MOOC】Python数据分析与展示-北京理工大学-【第二周】数据分析之展示

单元4:matplotlib库入门更多可参考:http://matplotlib.org/gallery.html写在前面:matplotlib库非常复杂,我们没必要花时间去学习所有函数,对于该库,应...
  • linzch3
  • linzch3
  • 2017年04月30日 23:44
  • 1020
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:python抓取中科院大学招聘
举报原因:
原因补充:

(最多只允许输入30个字)