- 博客(25)
- 资源 (5)
- 收藏
- 关注
原创 sdk、开源工具
<!--google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//--><script type="text/javascript"
2008-04-30 15:58:00 1193
原创 百度 google的垂直搜索
我们发现在百度、google这样的搜索引擎里面,其实已经包含了垂直搜索的概念。 1、 天气 在百度中搜索天气将为出现你的ip所在的城市的天气。Google没有直接返回。2、 股票在google中搜索“五粮液 股票”,出现的是:000858 - 五粮液 (深圳交易所)谷歌财经 新浪财经 搜狐证券 网易财经 和讯 东方财富
2008-04-29 13:13:00 1501
原创 如何识别网页中的地址信息
如何识别网页中的地址信息1、可以考虑使用状态机的识别办法。下表是一个状态转换表。可以识别大多数的地址。如果要识别更多的情况,可以丰富这个表格。2、使用状态机可以找到一段话中地址的结束位置。 根据状态图的方法判断路的信息是否是正确。 市|县|区|镇|环路|段|路|街|道|巷|胡同|号|楼
2008-04-29 12:48:00 1094
原创 使用dataset提高查询速度
把数据库表放在内存中,使用dataset来管理。使用datatable的选择函数dsDataSet1.Tables[0].Select("id)来选取数据。 (1)首先把表装入到内存的DataSet中con = new System.Data.OracleClient.OracleConnection("……"); selectCMD = con.Create
2008-04-29 12:44:00 858
原创 Sqldeveloper简单用法
Sqldeveloper这是一个oracle公司的免费工具。可以把sql server,mysql,access数据库的数据导入到oracle里面去。 连接sql server需要先下载一个jtds-1.2.2的jdbc驱动。然后在tool菜单的preferecnce选项下面的database结点添加这个驱动的jar文件。这个程序的路径必须全部是字母数字,不能有中文,
2008-04-29 12:43:00 1923
原创 关键词排行榜
对用户查询的关键词计数。选出每天、每周、每月的计数次数。就可以做出关键词热榜。 对某类关键词的热榜,需要人工圈定一组词语。统计这些词语的计数。比如房产、金融、技术方面的热点词语。如果是自动提取某类的热点词语就比较难了。需要分词聚类。可能先判断一个网页的类型,然后看那些关键词命中了这个网页。
2008-04-29 12:36:00 633
原创 怎样实时更新服务器的数据
1、通过数据库服务器的trigger机制。得到变化的数据。然后定制检查数据库,看数据是否有变化。2、通过监视文件的变化。.net机制下可以使用FileSystemWatcher得到数据。3、服务器实现socket连接,通过控制台使用命令更新数据。注意windows服务在读取文件的是一定要写清楚文件的绝对路径。
2008-04-28 15:44:00 1510
原创 垂直搜索数据源问题
垂直搜索与web搜索有很大的不同,一个非常大的区别在于对数据的获取。 google、百度的数据来自互联网。通过spider工具爬取得来。获取的网页通过去重,去除垃圾网站,最后通过适当的排序排序算法呈现在用户面前。 而垂直搜索的数据多数需要大量手工或者半自动化的处理,搜索的准确性、质量得到很多的提高。但是分析那些数据已经更新,如何得到新的数据,面临很多的困
2008-04-28 12:53:00 722
原创 lucene的多关键词或查询
//使用布尔查询BooleanQuery bquery = new BooleanQuery(); foreach (string str in listEn){ query1 = new TermQuery(new Term("en", str));//BooleanClause.Occur.SHOULD表示关键词或 bquery.Add(query
2008-04-25 15:05:00 1245 1
原创 Mapinfo的一些用法
1、打开: MapInfo.Data.Table table = MapInfo.Engine.Session.Current.Catalog.OpenTable(open.FileName);this.mapControl1.Map.Load(new MapTableLoader(table));2、 选择点 mapControl1.Map.GetDisplayCoordSys();
2008-04-25 13:10:00 4255
原创 用libsvm完成分类试验
(1)下载一个libsvm的.net 的包(2)然后把自己的数据整理成libsvm的输入格式。(3)使用训练数据得到训练结果(4)使用训练结果+测试数据,得到测试结果。(5)怎么调节libsvm的参数就不知道了。 需要根据应用的要求,数据的特点来修改参数(6)验证测试的结果。观察分类是否正确libsvm,A Library for Support Vector Machineshttp
2008-04-25 13:02:00 780
原创 对单词词库按照字符长度排序。然后去除含有“-”的单词。
excel 几个函数:search,find,len问题:对单词词库按照字符长度排序。然后去除含有“-”的单词。方法:使用len得到字符串的长度。 如len(A1),然后ctrl+c,选择一列,ctrl+D,复制公式到一整列。按照字符串长度排序 search函数查询字符串中是否有字符“-”。 公式:if(search("-",A1,0)>=0,true,fal
2008-04-25 12:17:00 775
原创 短信搜索相关
短信搜索的内容包括几类:衣食住行的本地信息、购买指南、娱乐八卦、彩票、心理测试、星座运程等、股票基金、健康常识、手机号码查询,公交航班信息铃声,图片等。在短信搜索这些门类中,那些是用户必不可少的呢?我们发现很多都是有替代的产品,或者有非常多的竞争对手。(1)114,号码百事通。提供语音服务,信息也非常丰富。本来不是短信搜索,但由于对短信搜索的竞争压力很大,因此列在这里。 114的短信搜
2008-04-24 10:19:00 859
原创 在英文搜索时的单词拼写错误问题
用户输入的关键词常常有拼写错误。当单词错误错误的时候,查询结果受到很大的影响。这个时候拼写检查和纠正就非常有用。如google的拼写检查,他不会主动把拼写检查之后的结果给用户。它采取的办法是:给出一个纠正后的单词用于提示。常见的错误如下:(1)barbarossa(2)bussiness 其中business拼写错误(3)Betavus,应该是查询Batavus拼写检查器的算法可以参考:
2008-04-23 19:03:00 1473
原创 用FileSystemWatcher监视文件变化
c#中一个非常方便的工具。以前用vc++6.0实现监视文件变化,要么需要函数钩子,要么需要写驱动程序。System.IO.FileSystemWatcher watcher = new System.IO.FileSystemWatcher(path, baseName); FileSystemEventHandler handler = new Fil
2008-04-23 18:48:00 1111
转载 Lucene基本知识
本文仅记录一些简单的使用方法,供初学者参考。以下例子采用 Lucene.NET 1.9 版本,可取去 Lucene.Net 下载。1. 基本应用using System;using System.Collections.Generic;using System.Text;using Lucene.Net;using Lucene.Net.Analysis;using Lucene.Net.An
2008-04-22 14:56:00 839 1
转载 Lucene 的搜索
Lucene 的搜索 以上完成了索引的建立和一些关于索引的知识,但是光有索引是不行的,我们真正要做的检索,这才是我们的关键。现在我们看看 lucene 的检索吧。 认识检索从检索的工具开始吧! IndexSearcher 类是 lucene 用于检索的工具类,我们在检索之前要得到这个类的实例。 第一步我们看以下代码: IndexSearcher searcher
2008-04-22 14:42:00 865
原创 分析MobileNative
1 Native的数据表现形式包括sms,wap、web site等等形式。目前native还只有北京的数据。 Native
2008-04-22 13:39:00 767
原创 oracle 中添加有&符号
需要先使用set define off。关闭识别变量的开关才能正常更新。toad中使用sql plus,执行速度要快一些。toad不会没有响应。
2008-04-21 14:45:00 1031 1
原创 繁体转换简体的程序(c#)
//big5繁体转换简体的程序 public class Big5toGB2312 { [DllImport("kernel32.dll", EntryPoint = "LCMapStringA")] public static extern int LCMapString(int Locale, int dwMa
2008-04-18 12:53:00 842
原创 lucene的实时更新
同一时刻只能有一个对索引的写操作,在写的同时可以进行搜索 。但是实践发现,对索引写了之后,并不能马上查询到结果。如果重新IndexSearcher indexSearcher = new Lucene.Net.Search.IndexSearcher(Parameter.indexPath)。这样就可以马上看到更新的结果。不利在于:这样重新new一个indexsearcher对象
2008-04-18 12:49:00 1803 1
原创 怎么做自然语言理解搜索
可以简单的认为:自然语言搜索,就是做一个转换 ( keywords,parameter)=convert(nature language); 我们把自然语言转换称为一批关键词和相应的参数。这些转换包括理解用户要查询的类型属于那个方面,错别字的处理等等。怎么把用户的查询规范话。
2008-04-18 12:45:00 853
原创 怎么改变listbox的item颜色(C#)
(1)需要先设置属性:该事件由所有者描述的 ListBox 使用。仅当 DrawMode 属性设置为 DrawMode.OwnerDrawFixed 或 DrawMode.OwnerDrawVariable 时,才引发该事件。可以使用该事件来执行在 ListBox 中绘制项所需的任务。如果具有大小可变的项(当 DrawMode 属性设置为 DrawMode.OwnerDrawVariable
2008-04-18 12:41:00 5694
原创 移动搜索被认为是一个新兴的搜索领域,但美国在开发无线数据业务方面相对落后?
移动搜索被认为是一个新兴的搜索领域,但美国在开发无线数据业务方面相对落后。为什么美国会落后?是技术能力不够,还是没有足够的需求。是否美国的手机上wap非常方便,大家都使用wap?
2008-04-09 15:28:00 720
logview里面SourceXML页面,找到 <TaskPlan> </TaskPlan>里面的内容的json格式转换
2023-09-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人