抓取网站商品详情需要使用爬虫技术,可以使用 PHP 的 CURL 库来发送 HTTP 请求,然后解析 HTML 页面,获取商品详情信息。以下是一个简单的示例代码:
<?php
// 定义要抓取的商品 URL
$url = "https://example.com/product/123";
// 发送 HTTP 请求,获取 HTML 页面内容
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($ch);
curl_close($ch);
// 解析 HTML 页面,获取商品详情信息
$doc = new DOMDocument();
@$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$name = $xpath->query("//h1[@class='product-name']/text()")->item(0)->nodeValue;
$price = $xpath->query("//span[@class='price']/text()")->item(0)->nodeValue;
$description = $xpath->query("//div[@class='product-description']/text()")->item(0)->nodeValue;
// 输出商品详情信息
echo "商品名称:$name\n";
echo "商品价格:$price\n";
echo "商品描述:$description\n";
?>
这个示例代码中,我们首先定义了要抓取的商品 URL,然后使用 CURL 库发送 HTTP 请求,获取 HTML 页面内容。接着,我们使用DOMDocument 和 DOMXPath 类解析 HTML 页面,获取商品名称、价格和描述信息。最后,我们输出商品详情信息。需要注意的是,这个示例代码中没有考虑一些异常情况,例如网络连接失败、页面内容无法解析等。在实际应用中,需要根据具体情况进行异常处理。
解析效果展示: