毕业设计 基于python的网络爬虫-基于python的网络爬虫

一、从小说网站抓取一本小说

import urllib2:python库,提供一系列针对url的操作方法

import re:re正则表达式,提供了一系列针对正则表达式的方法

BeautifulSoup4库:from bs4 import BeautifulSoup

BeautifulSoup4是一个从html或者xml中提取数据的py库

二、爬取西安工业大学的就业管理系统

http://jy.51uns.com:8022/Pro_StudentEmploy/StudentJobFair/Zhaoping.aspx?WorkType=0

爬去之后写进mysql数据库中(MySQLdb用于和mysql建立连接,相当于一个驱动);注意:python3装不上这个驱动,python3需要使用第三方库

1、详细情形:(1)运用Ajax异步交互方法,把上面的内容归为两类(静态内容:不需要改变;动态交互:会改变的,从数据库中读取的,需要维护的信息,如上述的招聘信息,会动态发生改变)

第一步:打开这个url时,访问服务器端指定服务,获取静态资源,渲染显示页面

第二步:使用Ajax异步交互,根据数据获取的url,获取招聘信息等动态资源,渲染显示

异步交互的好处:页面无需刷新就可以动态改变上一页和下一页【因为有一个网址是专门来进行服务器交互的,用户传递参数,根据参数选择,动态改变网页的内容。(用Ajax异步交互方法动态,从服务器端获取数据,用前端的编程语言动态的改

  • 3
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值