php正方系统抓取课表,php实现模拟登陆方正教务系统抓取课表

这篇文章主要介绍了php实现模拟登陆方正教务系统抓取课表的相关资料,需要的朋友可以参考下

课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。

其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。

1,解决掉验证码

其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的 验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这 是不是真的~当然,这只对正方有效。

2,php 的curl 模拟登陆

接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说!

//模拟登陆

function curl_request($url,$post='',$cookie='', $returnCookie=0){

$curl = curl_init();

curl_setopt($curl, CURLOPT_URL, $url);

curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');

curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);

curl_setopt($curl, CURLOPT_AUTOREFERER, 1);

curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url

if($post) {

curl_setopt($curl, CURLOPT_POST, 1);

curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));

}

if($cookie) {

curl_setopt($curl, CURLOPT_COOKIE, $cookie);

}

curl_setopt($curl, CURLOPT_HEADER, $returnCookie);

curl_setopt($curl, CURLOPT_TIMEOUT, 20);

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

$data = curl_exec($curl);

if (curl_errno($curl)) {

return curl_error($curl);

}

curl_close($curl);

if($returnCookie){

list($header, $body) = explode("\r\n\r\n", $data, 2);

preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);

$info['cookie'] = substr($matches[1][0], 1);

$info['content'] = $body;

return $info;

}else{

return $data;

}

}

3,教务系统登陆页面的隐藏字段

举个栗子

复制代码 代码如下:

这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用)

//登陆页面的隐藏字段

function getView(){

$url = 'http://jw.hzau.edu.cn/default2.aspx';

$result = curl_request($url);

$pattern = '//is';

preg_match_all($pattern, $result, $matches);

$res[0] = $matches[1][0];

return $res[0] ;

}

//返回教室查询页面的隐藏值

private function getViewJs($cookie,$xh){

$url = "http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";

$result = curl_request($url,'',$cookie);

$pattern = '//is';

preg_match_all($pattern, $result, $matches);

$res[0] = $matches[1][0];

return $res[0] ;

}

4,cookie 的获取

function login($xh,$pwd){

$url = 'http://jw.hzau.edu.cn/default2.aspx';

$post['__VIEWSTATE'] = $this->getView();

$post['txtUserName'] = $xh; //填写学号

$post['TextBox2'] = $pwd; //填写密码

$post['txtSecretCode'] = '';

$post['lbLanguage'] = '';

$post['hidPdrs'] = '';

$post['hidsc'] = '';

$post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '学生');

$post['Button1'] = iconv('utf-8', 'gb2312', '登录');

$result = curl_request($url,$post,'', 1);

return $result['cookie'];

}

5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组

//返回课表字符串

private function classresult($xh,$pwd){

date_default_timezone_set("PRC"); //时区设置

$classList = "";//声明课表变量

$cookie = $this->login($xh,$pwd);

$view = $this->getViewJs($cookie,$xh);//验证密码是否正确

//如果密码正确

if (!empty($view)) {

$url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";

$result = curl_request($url,'',$cookie); //保存的cookies

preg_match_all('/([\w\W]*?)/',$result,$out);

$table = $out[0][0]; //获取整个课表

preg_match_all('/([\w\W]*?)/',$table,$out);

$td = $out[1];

$length = count($td);

//获得课程列表

for ($i=0; $i < $length; $i++) {

$td[$i] = str_replace("

", "", $td[$i]);

$reg = "/{(.*)}/";

if (!preg_match_all($reg, $td[$i], $matches)) {

unset($td[$i]);

}

}

$td = array_values($td); //将课程列表数组重新索引

$tdLength = count($td);

for ($i=0; $i < $tdLength; $i++) {

$td[$i] = iconv('GB2312','UTF-8',$td[$i]);

}

//将课表转换成数组形式

function converttoTable($table){

$list = array(

'sun' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'mon' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'tues' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'wed' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'thur' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'fri' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

),

'sat' => array(

'1,2' => '',

'3,4' => '',

'5,6' => '',

'7,8' => '',

'9,10' => ''

)

);

$week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");

$order = array('1,2','3,4','5,6','7,8','9,10');

foreach ($table as $key => $value) {

$class = $value;

foreach ($week as $key => $weekDay) {

$pos = strpos($class,$weekDay);

// echo $pos;

if ($pos) {

$weekArrayDay = $key; //获取list数组中的第一维key

foreach ($order as $key => $orderClass) {

$pos = strpos($class,$orderClass);

if ($pos) {

$weekArrayOrder = $orderClass; //获取该课程是第几节

break;

}

}

break;

}

}

$list[$weekArrayDay][$weekArrayOrder] = $class;

}

return $list;

}

//调用函数

return converttoTable($td);

}else{

return 0;

}

}

6,再试试查询空教室的功能

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

相关文章

相关视频

网友评论

文明上网理性发言,请遵守 新闻评论服务协议我要评论

47d507a036d4dd65488c445c0974b649.png

立即提交

专题推荐064df72cb40df78e80e61b7041ee044f.png独孤九贱-php全栈开发教程

全栈 100W+

主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门

7dafe36c040e31d783922649aefe0be1.png玉女心经-web前端开发教程

入门 50W+

主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门

04246fdfe8958426b043c89ded0857f1.png天龙八部-实战开发教程

实战 80W+

主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习

php中文网:公益在线php培训,帮助PHP学习者快速成长!

Copyright 2014-2020 https://www.php.cn/ All Rights Reserved | 苏ICP备2020058653号-1e6cebb680dfe320dad7e62bd6442c3a6.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值