dede采集过滤规则集锦

原创 2007年10月10日 13:23:00

1.采集去除链接


[Copy to clipboard]CODE:
{dede:trim}]*)>([^<]*){/dede:trim}

--------------------------------

让field:title 标题突破30这个长度,修改代码的方法
找到./include/inc_arcpart_view.php
行291 :
if($titlelen=="") $titlelen = 30;
修改为
if($titlelen=="") $titlelen = 60;
就可以了,然后,你可以这样调用了
{dede:channelArtlist typeid='0' col=1 tablewidth='100%'}
{dede:arclist row="10"}
[field:title function="cn_substr('@me',38)" /]


{/dede:arclist}
{/dede:channelArtlist}

把这个延伸一下:关于inc_arcpart_view.php
function GetArcList($typeid=0,$row=10,$col=1,$titlelen=30,$infolen=160,
$imgwidth=120,$imgheight=90,$listtype="all",$orderby="default",$keyword="",
$innertext="",$tablewidth="100",$arcid=0,$idlist="")
这里的参数都可以更改你实际需要的模板元素尺寸大小.

 

2. 采集过虑中去掉链接保留文字的方法!

柏老大的方法是{dede:trim}<a ([^>]*)>([^<]*)</a>{/dede:trim}

正确的使用方法!如下:
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}

做成两条采集规则就可以了!
在实际使用中好像([^<]*)([^>]*)两条一起使用才行!

3. 过滤div
{dede:trim}]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
过滤js
{dede:trim}]*)>([^<]*){/dede:trim}


过滤未知变量字符
固定(.*)固定


4.dede万能过滤代码
CODE:
{dede:trim}
{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}

5.织梦标题不全,鼠标指向显示全部的代码:
{dede:arclist titlelen='100'}

[field:title function=' ( strlen("@me")>40 ? cn_substr("@me",40): "@me" ) '/]
{/dede:arclist}

6.dede/inc/inc_archives_functions.php第100行(flash频道远程flash本地化的BUG)
$cfg_uploaddir = $GLOBALS['media_dir'];
修改成
$cfg_uploaddir = $GLOBALS['cfg_other_medias']; 

dede采集过滤规则

dede采集基础教程--过滤规则   在这里,我会分批分段的给大家介绍一些dede的使用方法心得.主要是给一些刚刚接触dede的站长朋友们指个路. dede的基本功能在他们的技术文档里面有很详尽的...
  • wenqingzzz
  • wenqingzzz
  • 2014年09月20日 10:08
  • 297

dedecms采集功能的详细介绍(十)

dedecms采集功能的详细介绍(十) 今天来给大家讲解下dedecms的采集功能,希望大家认真学习 一.采集第一要素:确定目标网站 二.路径:后台--采集--采集节...
  • lkcsjfg
  • lkcsjfg
  • 2015年01月06日 14:21
  • 614

dede采集或更新搜索文章时cpu100%跑满卡死解决方法

dede采集或更新搜索文章时cpu100%跑满卡死解决方法!现在大部分虚拟主机提供商,都有设置目录权限的控制面板提供。这点请咨询主机商,寻求解决办法,不能因为使用虚拟主机,就放弃做安全设置。 常见问...
  • forest_fire
  • forest_fire
  • 2017年07月01日 15:44
  • 306

织梦采集侠采集问题

用织梦的后台开发个好几个项目,最近又了解了一下织梦的采集侠,觉得简单易上手,在这里简单的总结一下采集过程和所遇到的问题。     一:采集侠下载安装          可以选择在官网直接下载:http...
  • wbx_wlg
  • wbx_wlg
  • 2016年10月20日 14:50
  • 1195

关关采集器规则编写教程(最详细的教程)

首先需要了解下 关关采集器通用替代符    1.  \d*  表示数字    2.  \s*  空格或换行    3.  .+? 表示不需要的字符    4.   .* 表示字符    5....
  • pangzimin
  • pangzimin
  • 2014年01月23日 20:41
  • 988

dede自动采集 自动伪原创 自动发布一体化插件

dede自动采集 自动伪原创 自动发布一体化插件 dedecms标签 dede蓝财采集插件更新至第三代 先说下升级的功能: 结合了第一代全自动采集插件。。第二代全自动采...
  • wyncxge
  • wyncxge
  • 2015年01月21日 13:04
  • 1076

dede织梦_采集规则技巧-过滤-替换

接口 @me=str_replace('被替换字','替换字',@me); 官方自带 {dede:trim replace=''}]*)>(.*){/dede:trim} {dede:tr...
  • snihcel
  • snihcel
  • 2013年05月21日 01:15
  • 904

火车头采集器 题解页面信息采集 过滤采集内容

网址采集用多页的方式,先添加第一页,一般是没有规律的,然后从2到n都是有规律的 采集网址时,搜索页面的第一条在源代码中位置,看前面些附近的第一次出现的字符串作为起点,如 。然后再看最后一条源代码中...
  • sflsgfs
  • sflsgfs
  • 2016年05月02日 09:58
  • 1831

wireshark过滤规则及使用方法

Wireshark 基本语法,基本使用方法,及包过滤规则: 1.过滤IP,如来源IP或者目标IP等于某个IP 例子: ip.src eq 192.168.1.107 or ip.ds...
  • wojiaopanpan
  • wojiaopanpan
  • 2017年04月10日 11:41
  • 2110

如何使用Wireshark规则精准过滤网络包系列之 显示过滤器

现在从网上看到的一些wireshark过滤规则的介绍,都是比较老一点的,新版本的语法好像有所变化,所以在这里写一篇基于最新的1.12版本的wireshark规则系列。...
  • ghost045
  • ghost045
  • 2015年03月24日 13:33
  • 4872
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:dede采集过滤规则集锦
举报原因:
原因补充:

(最多只允许输入30个字)