自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据挖掘爱好者

关注搜索、推荐相关算法

  • 博客(25)
  • 资源 (5)
  • 收藏
  • 关注

原创 sdk、开源工具

<!--google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//--><script type="text/javascript"

2008-04-30 15:58:00 1193

原创 百度 google的垂直搜索

 我们发现在百度、google这样的搜索引擎里面,其实已经包含了垂直搜索的概念。 1、  天气 在百度中搜索天气将为出现你的ip所在的城市的天气。Google没有直接返回。2、  股票在google中搜索“五粮液 股票”,出现的是:000858  - 五粮液 (深圳交易所)谷歌财经   新浪财经   搜狐证券   网易财经   和讯   东方财富  

2008-04-29 13:13:00 1501

原创 如何识别网页中的地址信息

如何识别网页中的地址信息1、可以考虑使用状态机的识别办法。下表是一个状态转换表。可以识别大多数的地址。如果要识别更多的情况,可以丰富这个表格。2、使用状态机可以找到一段话中地址的结束位置。 根据状态图的方法判断路的信息是否是正确。 市|县|区|镇|环路|段|路|街|道|巷|胡同|号|楼

2008-04-29 12:48:00 1094

原创 使用dataset提高查询速度

把数据库表放在内存中,使用dataset来管理。使用datatable的选择函数dsDataSet1.Tables[0].Select("id)来选取数据。 (1)首先把表装入到内存的DataSet中con = new System.Data.OracleClient.OracleConnection("……");            selectCMD = con.Create

2008-04-29 12:44:00 858

原创 Sqldeveloper简单用法

Sqldeveloper这是一个oracle公司的免费工具。可以把sql server,mysql,access数据库的数据导入到oracle里面去。          连接sql server需要先下载一个jtds-1.2.2的jdbc驱动。然后在tool菜单的preferecnce选项下面的database结点添加这个驱动的jar文件。这个程序的路径必须全部是字母数字,不能有中文,

2008-04-29 12:43:00 1923

原创 关键词排行榜

         对用户查询的关键词计数。选出每天、每周、每月的计数次数。就可以做出关键词热榜。         对某类关键词的热榜,需要人工圈定一组词语。统计这些词语的计数。比如房产、金融、技术方面的热点词语。如果是自动提取某类的热点词语就比较难了。需要分词聚类。可能先判断一个网页的类型,然后看那些关键词命中了这个网页。

2008-04-29 12:36:00 633

原创 怎样实时更新服务器的数据

 1、通过数据库服务器的trigger机制。得到变化的数据。然后定制检查数据库,看数据是否有变化。2、通过监视文件的变化。.net机制下可以使用FileSystemWatcher得到数据。3、服务器实现socket连接,通过控制台使用命令更新数据。注意windows服务在读取文件的是一定要写清楚文件的绝对路径。

2008-04-28 15:44:00 1510

原创 垂直搜索数据源问题

        垂直搜索与web搜索有很大的不同,一个非常大的区别在于对数据的获取。        google、百度的数据来自互联网。通过spider工具爬取得来。获取的网页通过去重,去除垃圾网站,最后通过适当的排序排序算法呈现在用户面前。        而垂直搜索的数据多数需要大量手工或者半自动化的处理,搜索的准确性、质量得到很多的提高。但是分析那些数据已经更新,如何得到新的数据,面临很多的困

2008-04-28 12:53:00 722

原创 lucene的多关键词或查询

//使用布尔查询BooleanQuery bquery = new BooleanQuery();          foreach (string str in listEn){       query1 = new TermQuery(new Term("en", str));//BooleanClause.Occur.SHOULD表示关键词或       bquery.Add(query

2008-04-25 15:05:00 1245 1

原创 Mapinfo的一些用法

1、打开: MapInfo.Data.Table table = MapInfo.Engine.Session.Current.Catalog.OpenTable(open.FileName);this.mapControl1.Map.Load(new MapTableLoader(table));2、 选择点 mapControl1.Map.GetDisplayCoordSys();

2008-04-25 13:10:00 4255

原创 用libsvm完成分类试验

(1)下载一个libsvm的.net 的包(2)然后把自己的数据整理成libsvm的输入格式。(3)使用训练数据得到训练结果(4)使用训练结果+测试数据,得到测试结果。(5)怎么调节libsvm的参数就不知道了。     需要根据应用的要求,数据的特点来修改参数(6)验证测试的结果。观察分类是否正确libsvm,A Library for Support Vector Machineshttp

2008-04-25 13:02:00 780

原创 对单词词库按照字符长度排序。然后去除含有“-”的单词。

excel 几个函数:search,find,len问题:对单词词库按照字符长度排序。然后去除含有“-”的单词。方法:使用len得到字符串的长度。      如len(A1),然后ctrl+c,选择一列,ctrl+D,复制公式到一整列。按照字符串长度排序      search函数查询字符串中是否有字符“-”。      公式:if(search("-",A1,0)>=0,true,fal

2008-04-25 12:17:00 775

原创 短信搜索相关

短信搜索的内容包括几类:衣食住行的本地信息、购买指南、娱乐八卦、彩票、心理测试、星座运程等、股票基金、健康常识、手机号码查询,公交航班信息铃声,图片等。在短信搜索这些门类中,那些是用户必不可少的呢?我们发现很多都是有替代的产品,或者有非常多的竞争对手。(1)114,号码百事通。提供语音服务,信息也非常丰富。本来不是短信搜索,但由于对短信搜索的竞争压力很大,因此列在这里。     114的短信搜

2008-04-24 10:19:00 859

原创 在英文搜索时的单词拼写错误问题

 用户输入的关键词常常有拼写错误。当单词错误错误的时候,查询结果受到很大的影响。这个时候拼写检查和纠正就非常有用。如google的拼写检查,他不会主动把拼写检查之后的结果给用户。它采取的办法是:给出一个纠正后的单词用于提示。常见的错误如下:(1)barbarossa(2)bussiness 其中business拼写错误(3)Betavus,应该是查询Batavus拼写检查器的算法可以参考:

2008-04-23 19:03:00 1473

原创 用FileSystemWatcher监视文件变化

 c#中一个非常方便的工具。以前用vc++6.0实现监视文件变化,要么需要函数钩子,要么需要写驱动程序。System.IO.FileSystemWatcher watcher = new System.IO.FileSystemWatcher(path, baseName);                    FileSystemEventHandler handler = new Fil

2008-04-23 18:48:00 1111

转载 Lucene基本知识

本文仅记录一些简单的使用方法,供初学者参考。以下例子采用 Lucene.NET 1.9 版本,可取去 Lucene.Net 下载。1. 基本应用using System;using System.Collections.Generic;using System.Text;using Lucene.Net;using Lucene.Net.Analysis;using Lucene.Net.An

2008-04-22 14:56:00 839 1

转载 Lucene 的搜索

      Lucene 的搜索  以上完成了索引的建立和一些关于索引的知识,但是光有索引是不行的,我们真正要做的检索,这才是我们的关键。现在我们看看 lucene 的检索吧。 认识检索从检索的工具开始吧! IndexSearcher 类是 lucene 用于检索的工具类,我们在检索之前要得到这个类的实例。 第一步我们看以下代码: IndexSearcher searcher

2008-04-22 14:42:00 865

原创 分析MobileNative

    1 Native的数据表现形式包括sms,wap、web site等等形式。目前native还只有北京的数据。    Native

2008-04-22 13:39:00 767

原创 oracle 中添加有&符号

需要先使用set define off。关闭识别变量的开关才能正常更新。toad中使用sql plus,执行速度要快一些。toad不会没有响应。 

2008-04-21 14:45:00 1031 1

原创 怎么替换excel中的问号

查找问号只需要使用“~? ”只要在前面加一个~就行了 

2008-04-21 13:59:00 12278 1

原创 繁体转换简体的程序(c#)

      //big5繁体转换简体的程序        public class Big5toGB2312        {            [DllImport("kernel32.dll", EntryPoint = "LCMapStringA")]            public static extern int LCMapString(int Locale, int dwMa

2008-04-18 12:53:00 842

原创 lucene的实时更新

同一时刻只能有一个对索引的写操作,在写的同时可以进行搜索 。但是实践发现,对索引写了之后,并不能马上查询到结果。如果重新IndexSearcher  indexSearcher = new Lucene.Net.Search.IndexSearcher(Parameter.indexPath)。这样就可以马上看到更新的结果。不利在于:这样重新new一个indexsearcher对象

2008-04-18 12:49:00 1803 1

原创 怎么做自然语言理解搜索

可以简单的认为:自然语言搜索,就是做一个转换 ( keywords,parameter)=convert(nature language); 我们把自然语言转换称为一批关键词和相应的参数。这些转换包括理解用户要查询的类型属于那个方面,错别字的处理等等。怎么把用户的查询规范话。

2008-04-18 12:45:00 853

原创 怎么改变listbox的item颜色(C#)

(1)需要先设置属性:该事件由所有者描述的 ListBox 使用。仅当 DrawMode 属性设置为 DrawMode.OwnerDrawFixed 或 DrawMode.OwnerDrawVariable 时,才引发该事件。可以使用该事件来执行在 ListBox 中绘制项所需的任务。如果具有大小可变的项(当 DrawMode 属性设置为 DrawMode.OwnerDrawVariable

2008-04-18 12:41:00 5694

原创 移动搜索被认为是一个新兴的搜索领域,但美国在开发无线数据业务方面相对落后?

移动搜索被认为是一个新兴的搜索领域,但美国在开发无线数据业务方面相对落后。为什么美国会落后?是技术能力不够,还是没有足够的需求。是否美国的手机上wap非常方便,大家都使用wap? 

2008-04-09 15:28:00 720

logview里面SourceXML页面,找到 <TaskPlan> </TaskPlan>里面的内容的json格式转换

1.打开Chrome左上角三个点按钮 -> 更多工具 -> 扩展程序 2.打开右上角的开发者模式,点击加载已解压缩的扩展程序,导入上述文件夹 3. 找到插件,将其锁定在工具栏 4.把logview 里面SourceXML页面,找到 <TaskPlan> </TaskPlan>里面的内容,copy到这个插件里面的左侧即可使用了。

2023-09-15

出价公式推导 1705.09416.pdf

Optimal Real-Time Bidding for Display Advertising

2021-05-28

数字ip转ip v4的工具

数字ip转ip v4的excel工具,数字ip转ip v4的excel工具

2018-02-02

RTL8188C_8192C_USB_linux_v4.0.2_9000.20130911

无线网卡驱动 rtl 8188 网卡

2017-05-20

速卖通标题优化技巧

速卖通标题优化各种功能: 标题诊断 热词分析 宝贝找词 标题优化 海量直通车关键词

2015-11-19

张乐博士的最大熵手册

张乐博士的最大熵手册 张乐博士的最大熵手册 张乐博士的最大熵手册

2011-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除