用PHP的XML扩展库读取CSDN博客的RSS列表信息

首先给大家介绍什么是RSS,我自己的理解RSS就是一种基于标准的XML格式的信息的聚合,RSS订阅的好处是没有广告或者图片来影响标题或者文章概要的阅读。先说说CSDN博客的RSS订阅在哪里?不知道小伙伴注意过没有,在个人博客的右上角就有RSS订阅这项功能,点击这个按钮,就会进入RSS订阅的模式,其实这就是一个xml的文件。我们可以把这个RSS下载下来,保存为xml的文件,使用文本编辑器就可以查看结构,下面是我写的博客的RSS文件的信息,只截取了其中一部分内容。

这里写图片描述
下面我们就用两种方法解析xml文件,获得我们想要的信息。

第一种方法:使用SimpleXML里的simplexml_load_file函数,代码如下

<?php
$xml=simplexml_load_file('http://blog.csdn.net/u012811078/rss/list');
//上面是我博客里RSS的地址
foreach ($xml->channel->item as $item) {
echo "文章标题:".$item->title."<br/>";
echo "文章作者:".$item->author."<br/>";
echo "文章地址:".$item->link."<br/>";
echo "发布时间:".$item->pubDate."<br/>";
echo "<hr/>";
}
?>

解析结果如下:
这里写图片描述

第二种方法:使用DOM库,代码如下:

<?php
  $doc=new DomDocument();
  $doc->load('http://blog.csdn.net/u012811078/rss/list');
  $nodes=$doc->getElementsByTagName('item');
  foreach ($nodes as $node) {
    echo "文章标题:".trim($node->getElementsByTagName('title')->item(0)->nodeValue)."<br/>";
    echo "文章作者:".$node->getElementsByTagName('author')->item(0)->nodeValue."<br/>";
    echo "文章地址:".$node->getElementsByTagName('link')->item(0)->nodeValue."<br/>";
    echo "发布时间:".$node->getElementsByTagName('pubDate')->item(0)->nodeValue."<br/>";
    echo "<hr />";
  }
?>

解析结果如下所示:
这里写图片描述

上面的例子只给你一个参考,你也可以获得其他的你需要的信息,并且把解析出来的数据存储在数据库里,并对数据进行分析。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值