dede文章内容采集和火车头采集文章发布到dede

今天解决了一个问题关于dedecms的采集问题,算是我今天的主要收获,
放教程
首先介绍dedecms内部采集,我采集过dedecms发现这个采集真的垃圾,动态的采不下来,真是垃圾,所以我就用它来采集静态的
直接上配置,让小伙伴自己琢磨。
碰上文件乱码了,网上说了一大堆,我估计就是电脑字体不够,重新下字体
,先大体说说吧 里面注意的就是内容两个字,前[内容]后 我先就是这方面吃了些小亏,然后用火车头用的是7.4的明天我一并发出来我的配置和模板,今天乱码 抱歉不能发出来
好了 先发dedecm采集规格

{dede:listconfig}
{dede:noteinfo notename="采集测试(二)" channelid="1" macthtype="string"
    refurl="http://www.bitscn.com/network/protocol/201105/193110.html" sourcelang="gb2312" cosort="asc"
  isref="no" exptime="10" usemore="0" /}
{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://www.bitscn.com/network/protocol/list_(*).html"
startid="1" endid="1" addv="1" urlrule="area" musthas=""
 nothas="" listpic="1" usemore="0"}
    {dede:addurls}{/dede:addurls}
    {dede:batchrule}{/dede:batchrule}
    {dede:regxrule}{/dede:regxrule}
    {dede:areastart}<div class="list-cc">{/dede:areastart}
    {dede:areaend}</div>{/dede:areaend}
{/dede:listrule}

{/dede:listconfig}

{dede:itemconfig}
{dede:sppage sptype='full' srul='1' erul='5'}<div class="page next-page">[内容]</div>{/dede:sppage}
{dede:previewurl}http://www.bitscn.com/network/protocol/201105/193110.html{/dede:previewurl}
{dede:keywordtrim}{/dede:keywordtrim}
{dede:descriptiontrim}{/dede:descriptiontrim}
{dede:item field='title' value='' isunit='' isdown=''}
   {dede:match}<h1 class="title">[内容]</h1>{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}{dede:item field='writer' value='' isunit='' isdown=''}
   {dede:match}{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}{dede:item field='source' value='' isunit='' isdown=''}
   {dede:match}<span>来源:[内容]</span>{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}{dede:item field='pubdate' value='' isunit='' isdown=''}
   {dede:match}时间:[内容]  <span>{/dede:match}
   
   {dede:function}{/dede:function}
{/dede:item}{dede:item field='body' value='' isunit='1' isdown='1'}
   {dede:match}<!--文章块开始-->[内容]<!--文章内分页结束-->{/dede:match}
   {dede:trim replace=""}<div class="contentgg">(.*)</div>{/dede:trim}
{dede:trim replace=""}<div align="center" style="padding-top:20px;">(.*)</div>{/dede:trim}
{dede:trim replace=""}<div class="page next-page">(.*)</div>{/dede:trim}
   {dede:function}{/dede:function}
{/dede:item}
{/dede:itemconfig}

下面为个人过滤规则

{dede:trim replace=""}<a([^>]*)>(.*)</a>{/dede:trim}
{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
{dede:trim replace=""}<span(.*)>{/dede:trim}
{dede:trim replace="<p>"}<p(.*)>{/dede:trim}
{dede:trim replace=""}</span>{/dede:trim}
{dede:trim replace=""}<section(.*)>{/dede:trim}
{dede:trim replace=""}<!--(.*)-->{/dede:trim}
{dede:trim replace=""}<table([^>]*)>(.*)</table>{/dede:trim}
{dede:trim replace=""}<style([^>]*)>(.*)</style>{/dede:trim}
{dede:trim replace=""}<img([^>]*)>{/dede:trim}
{dede:trim replace=""}<object([^>]*)>(.*)</object>{/dede:trim}
{dede:trim replace=""}<embed([^>]*)>(.*)</embed>{/dede:trim}
{dede:trim replace=""}<iframe([^>]*)>(.*)</iframe>{/dede:trim}
{dede:trim replace=""}<param([^>]*)>(.*)</param>{/dede:trim}
{dede:trim replace=""}<div([^.]*)>{/dede:trim}
{dede:trim replace=""}</section>{/dede:trim}
{dede:trim replace=""}<strong(.*)>{/dede:trim}
{dede:trim replace=""}</strong>{/dede:trim}
{dede:trim replace=""}</div>{/dede:trim}
{dede:trim replace=""}<br />{/dede:trim}
{dede:trim replace=""}</dd>{/dede:trim}
{dede:trim replace=""}</dl>{/dede:trim}
{dede:trim replace="kok体育官方app下载"}山西建筑工程集团有限公司{/dede:trim}
{dede:trim replace="kok体育官方"}山西建投{/dede:trim}

好了,下面为火车头配置文件
链接:https://pan.baidu.com/s/1bkynFL8Xre0qvLev6Wt5Og
提取码:e6t6
复制这段内容后打开百度网盘手机App,操作更方便哦
好了,以上为自动采集更新dede文章内容。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值