- 博客(12)
- 收藏
- 关注
转载 【trie树】应用于统计和排序
1. 什么是trie树 1.Trie树 (特例结构树) Trie树,又称单词查找树、字典树,是一种树形结构,是一种哈希树的变种,是一种用于快速检索的多叉树结构。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。 Trie的核心思想是
2013-10-30 09:26:07 215 1
转载 搜索引擎按其工作方式主要可分为三种
1. 搜索引擎的分类搜索引擎按其工作方式主要可分为三种:分别是全文搜索引擎(Full Text Search Engine)目录索引类搜索引擎(Search Index/Directory)元搜索引擎(Meta Search Engine)。 ■ 全文搜索引擎 全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheW
2013-10-30 09:23:00 7529
转载 SEO优化技术讲到头无非是内容与链接
SEO优化技术讲到头无非是内容与链接,而链接又建立于内容之上,所以内容就是SEO优化的基石。但是优质与独特的内容不是随手可得,为了追求独特的内容,伪原创技术就开始发展起来。SEO伪原创技术顾名思义就是伪造一些看似原创的内容来蒙蔽搜索引擎,从而获得更多的内链或外链,站群也是非常依赖伪原创技术的。素老胡写本文的用意在于用程序化的具体实现来告诫一些SEO新手或一直利用软件伪原创的朋友,这些方法只是掩耳盗
2013-09-27 14:54:53 261
转载 抽出的频率最高的50个词
import math def compute_entropy(word_list): wdict={} tot_cnt=0 for w in word_list: if w not in wdict: wdict[w] = 0 wdi
2013-08-16 15:04:44 224
转载 DedeCms表名
写表名是用 数据库名.表名 这样就能跨库读取如果用 DedeCms V5 之前用过其它版本的,模板标记有一个地方需要注意arclist 在V5中是不能调用整站的文档的主要原因是因为现在的频道是允许分表,因此arclist标记必须指定typeid或channelid为了补允调用全站数据的不足,V5中新增了 arcfulllist 标记,它的作用与 ar
2013-08-14 16:17:34 233
原创 Shell的一些基础命令备用
不管当前路径是什么,如果想要在自己的根目录$HOME中查找文件名符合*.txt的文件,使用~作为’pathname参数,波浪号~代表了你的$HOME目录。$ find ~ -name “*.txt” -print想要在当前目录及子目录中查找所有的‘ * . t x t’文件,可以用:$ find . -name “*.txt” -print想要的当前目录及子目录中查找文件名以一
2013-08-08 10:46:19 215
原创 对于这个理解不是很好,需要再研究下
对于这个理解不是很好,需要再研究下: 在使用find命令的-exec选项处理匹配到的文件时,find命令将所有匹配到的文件一起传递给exec执行。不幸的是,有些系统对能够传递给exec的命令长度有限制,这样在find命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是xargs命令的用处所在,特别是与find命令一起使用。Find命令把匹配到的文件传
2013-08-08 10:44:27 177
原创 python笔记
help(sys)help(int)help(list)help(dict)help(str)help(file)sys模块print sys.__doc__help(sys.exit)help(sys.stdin)help(sys.stdout)help(sys.stderr)1.运算符通常由左向右结合,即具有相同优先级的运算符按照从左向右的顺
2013-08-01 11:56:28 268
原创 dede文章标题-2级栏目-1级栏目-网站名
代码如下:{dede:field name='title'/}-{dede:field name='position'runphp='yes'} $tc="-"; //分隔符 $tw=$GLOBALS['cfg_list_symbol']; //调用位置分隔符 @me=html2text(@me); //去除html标签 $tf=split($tw,@me
2013-08-01 11:53:31 265
转载 python备份文件【记号】
代码如下#!/usr/local/python import os import time import string source=['/var/www/html/xxx1/','/var/www/html/xxx2/'] target_dir='/backup/' target=target_dir+time.strftime('%Y%m%d') zip_comm='zip
2013-08-01 11:49:44 204
转载 WordPress模板基本文件
WordPress模板基本文件style.css 样式表文件index.php 主页文件single.php 日志单页文件page.php 页面文件archvie.php 分类和日期存档页文件searchform.php 搜索表单文件search.php 搜索页面文件comments.php 留言区域文件(包括留言列表和留言框)404.php 404错误页面
2013-08-01 11:46:40 451
翻译 收集整理了一下wordpress常用的代码出来
收集整理了一下wordpress常用的代码出来,今天来发热门文章和随机文章的调用列子:一、wordpress实现热门文章第一种方法热门文章:调用出来的是按评论最多的倒序排列,带评论个数get_results(“SELECT comment_count,ID,post_title FROM $wpdb->posts ORDER BY comment_count D
2013-08-01 11:45:55 322
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人