php新手实战:自定义书源下载api

16 篇文章 0 订阅

网上有很多第三方小说网站提供小说下载,而下载的过程无非就是搜索书籍,然后找到下载链接点击下载即可。只是类似这种“良心”的小说网站实在是太少。大多数仅支持在线阅读。而如今,我却要利用这种为数不多的“良心”小说站点提供的书源来作为自己的书源接口。真是....让人唏嘘啊。希望大家还是抱着学习的心态来。本次主要是分享这种二次简易包装接口的方法。从而管中窥豹,举一反三。

tips:本次分享主要以学习交流为主,尊重书籍正版授权。

1.书源网站  

这次示范的网站为一个第三方小说站点。通过站内搜索返回的内容知道返回的是html内容。当然,如果是直接返回json数据的话我也就没必要写这篇博文了。不过返回的html也是有操作空间的。

2.解析网页构建接口

先看本地php运行效果吧。单php文件:index.php

主要用到了php的DOMDocument和DOMXPath来解析网页内容,然后构建json数据返回。具体的代码中已做注释。闲话少叙,直接上代码。

<?php
// 创建 cURL 句柄
$ch = curl_init();

// 设置 cURL 选项
curl_setopt($ch, CURLOPT_URL, 'http://www.aixiashu.info/modules/article/search.php'); // 设置要访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将响应保存为字符串而不直接输出
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); // 跟随重定向

// 设置 POST 参数
$postData = array(
    'searchkey' => $_GET['book'], // 第一个参数及其值
    'searchtype' => 'articlename' // 第二个参数及其值
);
curl_setopt($ch, CURLOPT_POST, true); // 设置为 POST 请求
curl_setopt($ch, CURLOPT_POSTFIELDS, $postData); // 设置 POST 参数

// 执行 cURL 请求并获取响应
$response = curl_exec($ch);

// 检查是否有错误发生
if (curl_errno($ch)) {
    echo 'cURL Error: ' . curl_error($ch);
    exit;
}

// 关闭 cURL 句柄
curl_close($ch);

// 输出响应内容
// echo $response;

// 创建一个 DOMDocument 对象
$dom = new DOMDocument();
$html = $response;
// 禁用标准的 libxml 错误,并启用用户错误处理
$libxml_previous_state = libxml_use_internal_errors(true);
// 解析
$dom->loadHTML($html);
// 清空 libxml 错误缓冲
libxml_clear_errors();
// 还原之前设置
libxml_use_internal_errors($libxml_previous_state);

 $xpath = new DOMXPath($dom);
 $autherElements =$xpath->query('//tr/td[contains(@class, "even")][2]');
 $links = $xpath->query('//td[contains(@class, "even")]/a');
// 创建一个数组来存储结果对象
$resultArray = array();

// 遍历查询结果并将 href 属性和文本值组成数组对象
foreach ($links as $index => $anchor) {
    $href = $anchor->getAttribute('href');
    $bookId = extractBookId($href);
    // 获取对应书的作者名
    $autherElement = $autherElements->item($index);
    $auther = $autherElement ? $autherElement->nodeValue : '';
    
    $resultArray[] = array(
        'href' => $href,
        'text' => $anchor->nodeValue,
        'bookid' => 'http://txt.aixiashu.info/modules/article/txtarticle.php?id='.$bookId,
        'auther' => $auther
    );
}

// 将数组转换为 JSON 格式
$jsonArray = json_encode($resultArray);

// 输出 JSON 数组
echo $jsonArray;


// 从 href 地址中提取 bookid 的函数
function extractBookId($href) {
    $pattern = '/\/(\d+)\/$/';
    preg_match($pattern, $href, $matches);
    return isset($matches[1]) ? $matches[1] : null;
}

?>

将该php文件放到php站点运行,就相当于提供了一个书源查询下载的接口。怎么样,是不是很简单。这种利用第三方的接口二次“包装”作为自定义使用接口。我只能说,香是真滴香。但是,不道德。所以,只是提供给大家这种写自用接口的思路。不推荐使用哈。 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

流情

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值