dede采集过滤规则集锦

原创 2007年10月10日 13:23:00

1.采集去除链接


[Copy to clipboard]CODE:
{dede:trim}]*)>([^<]*){/dede:trim}

--------------------------------

让field:title 标题突破30这个长度,修改代码的方法
找到./include/inc_arcpart_view.php
行291 :
if($titlelen=="") $titlelen = 30;
修改为
if($titlelen=="") $titlelen = 60;
就可以了,然后,你可以这样调用了
{dede:channelArtlist typeid='0' col=1 tablewidth='100%'}
{dede:arclist row="10"}
[field:title function="cn_substr('@me',38)" /]


{/dede:arclist}
{/dede:channelArtlist}

把这个延伸一下:关于inc_arcpart_view.php
function GetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$infolen=160,
$imgwidth=120,$imgheight=90,$listtype="all",$orderby="default",$keyword="",
$innertext="",$tablewidth="100",$arcid=0,$idlist="")
这里的参数都可以更改你实际需要的模板元素尺寸大小.

 

2. 采集过虑中去掉链接保留文字的方法!

柏老大的方法是{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}

正确的使用方法!如下:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}

做成两条采集规则就可以了!
在实际使用中好像([^<]*)([^>]*)两条一起使用才行!

3. 过滤div
{dede:trim}]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
过滤js
{dede:trim}]*)>([^<]*){/dede:trim}


过滤未知变量字符
固定(.*)固定


4.dede万能过滤代码
CODE:
{dede:trim}
{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}

5.织梦标题不全,鼠标指向显示全部的代码:
{dede:arclist titlelen='100'}

[field:title function=' ( strlen("@me")>40 ? cn_substr("@me",40): "@me" ) '/]
{/dede:arclist}

6.dede/inc/inc_archives_functions.php第100行(flash频道远程flash本地化的BUG)
$cfg_uploaddir = $GLOBALS['media_dir'];
修改成
$cfg_uploaddir = $GLOBALS['cfg_other_medias']; 

dede过滤规则-如何过滤"(1)"这种-正则表达式

国庆期间有网友问我DEDE采集里标题怎么过滤"(1)"这样的()+里面数字或者其它的.那时在外面玩,就没帮他解决,今天突然想起,就动手帮他做了这个问题.其实,这个问题对于会DEDE和正则表达式的人来说...
  • daima0371
  • daima0371
  • 2011-05-18 14:47:00
  • 810

织梦dedecms正则表达式采集过滤标签列表

DEDE无可置疑的成为CMS系统里的强都,可是其自带的采集系统对于一个菜鸟站长来说却是不容易的,如果采集的网站比较简单,那倒很容易,可是,如果要采集的网站很复杂,那一般的站长就很难应付了,比如内容过滤...
  • daima0371
  • daima0371
  • 2011-05-18 14:45:00
  • 880

dede采集过滤规则

dede采集基础教程--过滤规则   在这里,我会分批分段的给大家介绍一些dede的使用方法心得.主要是给一些刚刚接触dede的站长朋友们指个路. dede的基本功能在他们的技术文档里面有很详尽的...
  • wenqingzzz
  • wenqingzzz
  • 2014-09-20 10:08:35
  • 304

dedecms中自定义模型采集数据的方法

对于新建的dedecms自定义模型,如何采集数据呢?打开\dede\templets\co_add_step0.htm,找到(大约在17行)      $dsql->SetQuery("Select ...
  • lumengabc
  • lumengabc
  • 2013-12-09 10:56:48
  • 1313

织梦(dede)采集规则集合

  • 2010年08月13日 15:47
  • 452KB
  • 下载

dede自动采集 自动伪原创 自动发布一体化插件

dede自动采集 自动伪原创 自动发布一体化插件 dedecms标签 dede蓝财采集插件更新至第三代 先说下升级的功能: 结合了第一代全自动采集插件。。第二代全自动采...
  • wyncxge
  • wyncxge
  • 2015-01-21 13:04:47
  • 1281

DedeCMS采集后如何批量修改作者和来源的方法

采集后如何快速批量修改或替换文章的作者和来源?     已经采集好并已生成HTML了的文章或以前已发布的文章如何快速批量替换所有“来源”和“作者”呢?     第一步:     打开:dede(...
  • snuoke
  • snuoke
  • 2016-11-23 13:24:59
  • 656

DEDE自动采集插件演示版发布

QQ群 79231594(加群免费体验) 跟正式版相比,演示版本有以下特点:1.不限制网站域名,可以任意安装测试。2.安装包文件尺寸更小,精简了中文分词、拼音以及同义词词典,因此相关的功能也不能使用。...
  • yongsen_odaboy
  • yongsen_odaboy
  • 2018-02-08 20:48:13
  • 56

dede采集侠

  • 2012年10月24日 21:29
  • 1.46MB
  • 下载

织梦自定义模型如何实现采集功能

默认我们打开采集功能只有两个选项,但是我们在后台新加了模型,怎么办?新加的模型怎么才能实现采集呢?其实很简单。   打开\dede\templets\co_add_step0.htm,查找: ...
  • fujiafeihudui
  • fujiafeihudui
  • 2014-12-23 23:33:42
  • 1163
收藏助手
不良信息举报
您举报文章:dede采集过滤规则集锦
举报原因:
原因补充:

(最多只允许输入30个字)