- 博客(17)
- 资源 (11)
- 收藏
- 关注
原创 cygwin 安装 python setuptools
see http://serverfault.com/questions/7282/how-to-run-easy-install-in-cygwin$ wget http://peak.telecommunity.com/dist/ez_setup.py$ python ez_setup.py
2012-01-30 21:20:29 2645
原创 Extending linear models
1. 支持向量机能利用线性模型来实现对非线性分类边界的描绘。the trick is easy: transform the input using a nonlinear mapping; in other words, transform the instance space into a new space.由于用了非线性映射,在新空间里的一条直线,在原来的空间里看起来却不是直的。在新空
2012-01-29 20:01:30 595
原创 classification rules
1. Criteria for choosing testsThe basic criterion for choosing a test to add to a rule is to find one that covers as many positive examples as possible, while covering as few negative examples as po
2012-01-29 19:24:44 575
原创 可信度:评估机器学习结果
1. 分离器对训练集进行分类而得出的误差率并不能很好反映分类器未来的工作性能。2. 当训练和测试数据有限时,衡量一种学习方案使用在某一数据集上的误差率的方法:a. cross-validation 交叉验证 10-foldb. leave-one-out 留一法c. bootstrap 自引导法3. 预测概率a. 二次损失函数b. 信息损失函数4. 计算成本使用
2012-01-15 21:23:01 2320
原创 聚类
1. 基于距离的迭代聚类k-means 一个matlab实现: from: http://www.newsmth.net/nForum/article/AI/86245?p=1function label = litekmeans(X, k)n = size(X,2);last = 0;label = ceil(k*rand(1,n)); % random initializati
2012-01-08 20:51:29 936
原创 Instance-based learning
1. 距离的定义: 欧氏距离a. 属性值的标准化b. 在实践中,属性之间距离的真正含义是什么?2. 如何寻找最近邻居?a. kd-tree 既要求树有完美的平衡结构,又要求区域近似方形. 直角问题.b. ball tree 3. k-最近邻法4. 最近邻规则在实践中的问题a. 对于较大规模的训练数据集,速度往往很慢b. 碰到干扰数据,性能表现较差c. 当不同
2012-01-07 22:08:12 1956
转载 Logistic regression 逻辑回归 概述
from : http://hi.baidu.com/hehehehello/blog/item/0b59cd803bf15ece9023d96e.htmlLogistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的
2012-01-05 21:39:51 1730
原创 data mining statistical modeling
1. naive bayes model2. Laplace smoothing
2012-01-03 20:18:19 529
原创 data mining decision tree
1. 信息增益,熵2. ID3, C4.5, 基于信息增益的判定树构造 top-down divide-and-conquer algorithm, 每一步选择一个属性,使得信息增益最大。3. mining association rules 挖掘关联规则 - AProri算法coverage => supportaccuracy => confidenceassociatio
2012-01-03 20:15:48 905
转载 使用C3P0-0.9.1.jar包的问题:APPARENT DEADLOCK!!! Creating emergency threads for unassigned pending tasks!
from: http://blog.csdn.net/dingherry/article/details/6534494C3P0-0.9.1.jar包的问题出现了:view plain2011-06-09 16:15:57.500 [com.mchange.v2.c3p0.C3P0Registry]-[INFO] Initializing c3p0-0.9.1 [built 16-
2012-01-01 19:40:30 9031
原创 Is it safe to keep database connections open for long time?
see http://stackoverflow.com/questions/312702/is-it-safe-to-keep-database-connections-open-for-long-time其中的一个回复很有启发。如果不是这个功能要求7*24在运行的话,就没有必要保持长时间的数据库连接了。If you are talking about a client/server a
2012-01-01 19:37:17 839
原创 java thread CountDownLatch and CyclicBarrier
1. CountDownLatch山寨了一个的实现等待所有子线程结束的轮子,发现JDK已经支持了。CountDownLatch可以实现2种功能,1) 所有线程都结束时(wait for several threads to complete)2) 所有线程同时开始(coordinate the starting of threads)具体例子参考:http://www.javam
2012-01-01 19:33:04 859
原创 java thread.join method
最近用到了这样的一个功能,主进程需要等待一段功能完成后再继续运行,例如计算这段功能运行的时间。原来的实现使用了最基本的wait/notify来实现,后来发现了thread的join功能,发现用这个来实现更合理。原理如下:main thread. ... thread func; func.start(); func.join(); ...// the
2012-01-01 19:23:27 808
转载 tomcat 内存溢出问题
from: http://www.iteye.com/problems/10072最近客户反映经常抛出内存溢出的异常,在下面贴出一部分异常信息,希望大家能帮我分析一下,找出原因,万分感激! [CLOSE] ID:107 28000 [ACTION : get_mod ] Exception in thread "Thread-2" 2008-12-28 5:58:29 or
2012-01-01 19:17:03 11533
转载 MySQL replication monitor
from: http://www.softwareprojects.com/resources/programming/t-mysql-replication-monitor-1744.htmlWhat is MySQL ReplicationMySQL Replication is a great way to improve database performance and
2012-01-01 19:12:29 1095
原创 python file operation
和c语言一样,不能使用'rw'方式打开一个文件并进行读写,正确的方式是‘r+’,详见http://mail.python.org/pipermail/python-bugs-list/2001-May/005216.htmlBugs item #420771, was updated on 2001-05-02 10:11You can respond by visiting:
2012-01-01 11:32:54 1792
Inside Java Virtual Machine
2007-11-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人