- 博客(49)
- 资源 (7)
- 问答 (1)
- 收藏
- 关注
原创 数据挖掘算法学习(九)EM算法-上篇-多元高斯分布
EM算法大致分为两步——E步骤和M步骤。而在求解运算过程中,需要用到高斯分布,逆矩阵等数学知识。EM算法上篇先梳理一下基础的数学知识,具体EM算法的核心思想下篇再进行介绍。由于公式,矩阵太多,便手写一份推导,贴在下面。
2015-01-09 20:32:17 7072 2
原创 gnuplot画图技巧总结
最近用gnuplot画了不少图,关键字神马的每次用到都要重新去查使用文档,简直神烦。所以干脆将常用的技巧总结成文,以便日后查阅。一、gnuplot简介可能我说了半天还有人不造gnuplot是个啥东西呢。gnuplot,轻量级画图神器。放上维基百科的解释:gnuplot是一套跨平台的数学绘图自由软件。使用交互式接口,可以绘制数学函数图形,也可以从纯文字档读入简单格式的座标资料,绘制统计图表等等。它不是统计软件,也不是数学软件,它纯粹只是一套函数/资料绘图软件。它可以产生PNG,SVG,PS,HPGL,…
2014-11-27 18:20:43 31237 10
原创 具有无损连接性的BCNF分解 C++实现
何为BC范式?BCNF是3NF基础上的一种特殊情况,每个属性不传递依赖于R的候选键(包含关系),即每个表中只有一个候选键。算法伪代码输入:关系模式R以及R上的函数依赖集F输出:R的BCNF分解Result,它关于F具有无损连接性方法:Result = {R}while(存在Ri包含于Result,但Ri不是BCNF)begin
2014-11-27 11:12:48 4056 1
转载 C++:STL标准入门汇总
第一部分:(参考百度百科) 一、STL简介STL(Standard Template Library,标准模板库)是惠普实验室开发的一系列软件的统称。它是由Alexander Stepanov、Meng Lee和David R Musser在惠普实验室工作时所开发出来的。现在虽说它主要出现在C++中,但在被引入C++之前该技术就已经存在了很长的一段时间。STL的代码从广
2014-11-24 14:26:11 1088 1
原创 具有无损性连接和保持函数依赖的3NF分解C++实现
数据库范式对于数据库而言无疑是非常重要的(废话。。)本文主要内容为c++实现具有无损性连接和保持函数依赖的3NF分解。上篇文章中已经对各个范式进行了介绍,在此不再赘述。何为第三范式?第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息,即消除了传递依赖。算法伪代码输入:关系模式R及R上的函数依赖集F输出:R的3NF无损连接和保持函数依赖的分解Re
2014-11-18 14:21:17 5090 3
原创 数据挖掘十大算法总结--核心思想,算法优缺点,应用领域
参考了许多资料加上个人理解,对十大算法进行如下分类:•分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM•聚类算法:KMeans•统计学习:EM•关联分析:Apriori•链接挖掘:PageRank其中,EM算法虽可以用来聚类,但是由于EM算法进行迭代速度很慢,比kMeans性能差很多,并且KMeans算法 聚类效果没有比EM差多少,所以一般用kMeans进行聚类,而不是EM。
2014-11-03 10:43:01 17332 2
转载 数据库范式详解(二)
本文转载自http://jacki6.iteye.com/blog/774889范式应用 我们来逐步搞定一个论坛的数据库,有如下信息: (1) 用户:用户名,email,主页,电话,联系地址 (2) 帖子:发帖标题,发帖内容,回复标题,回复内容 第一次我们将数据库设计为仅仅存在表: 用户名 email 主页 电话 联系地址 发帖标题 发帖内容 回复标
2014-10-30 14:53:56 1308
原创 数据挖掘算法学习(八)Adaboost算法
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。
2014-10-24 11:53:09 9862
原创 emacs快捷键学习(一)--Linux最强大的编辑器
emacs是一个很强大的编辑器。常用的快捷键总结如下:退出emacs:ctrl+x ctrl+c移动到下一屏:ctrl+v移动到上一屏:alt+v将光标所在行移动到屏幕中间:ctrl+l将光标移动到上一行:ctrl+p(previous)将光标移动到下一行:ctrl+n(next)将光标右移:ctrl+f(forward)将光标左移:ctrl+b(backward)
2014-10-14 15:33:03 4985
原创 数据挖掘算法学习(七)SVM算法
SVM,支持向量机。数据挖掘中的一个经典算法,博主学了挺久,把学到的一些东西跟大家分享一下。支持向量机(SVM,Support Vector Machine)是在高维特征空间使用线性函数假设空间的学习系统,它由一个来自最优化理论的学习算法训练,该算法实现了一个由统计学习理论到处的学习偏置.此学习策略由Vapnik和他的合作者提出,是一个准则性的 并且强有力的方法.在它提出来的若干年来,在范
2014-10-11 17:27:19 4150
原创 error 2001:can't connect to local MySQL server through '/var/run/mysqld/mysql.socket(2)
ubuntu下出现的2002, "Can't connect to local MySQL server through socket '/var/run/mysqld/mysqld.sock' (2)解决方法:
2014-09-29 17:46:16 1846
原创 数据挖掘算法学习(六)CART算法
分类回归树算法:CART(Classification And Regression Tree)算法采用一种二分递归分割的技术,将当前的样本集分为两个子样本集,使得生成的的每个非叶子节点都有两个分支。因此,CART算法生成的决策树是结构简洁的二叉树。分类树两个基本思想:第一个是将训练样本进行递归地划分自变量空间进行建树的想法,第二个想法是用验证数据进行剪枝。CART与C4.5的
2014-09-24 11:04:04 3347
原创 数据挖掘算法学习(五)C4.5算法
分类决策树算法,其核心算法是ID3算法。目前应用在临床决策、生产制造、文档分析、生物信息学、空间数据建模等领域。算法的输入是带类标的数据,输出是树形的决策规则。
2014-09-24 10:44:28 4314
原创 常见排序c语言实现
void BubbleSort(int R[],int n) //冒泡排序 时间复杂度O(n2){ int i,j,temp,flag; for(i = n;i>=2;i--) { flag = 0; for(j=2;j<=i;j++) { if(R[j-1]>R[j]) { temp = R[j-1]; R[j-1] = R[j]; R[
2014-08-28 21:52:42 1116
原创 数据挖掘算法学习(四)PCA算法
算法简介主成分分析(PrincipalComponentAnalysis,简称PCA)是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。主要用于对特征进行降维。算法假设数据的概率分布满足高斯分布或是指数型的概率分布。方差高的向量视为主元。
2014-07-28 20:50:56 3363
原创 数据挖掘算法学习(三)NaiveBayes算法
算法简介NBC是应用最广的分类算法之一。朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。算法假设给定目标值时属性之间互相条件独立。算法输入训练数据 T={(x1,y1),(x2,y2),……,(xn,yn)}待分类数据x0=(x0(1),x0(2),……,x0(n)
2014-07-28 10:02:36 4806
原创 数据挖掘算法学习(二)weka简介
weka官方下载地址:http://www.cs.waikato.ac.nz/ml/weka/downloading.html
2014-07-27 17:35:30 2818
原创 数据挖掘算法学习(一)K-Means算法
算法简介:K-Means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准的k个聚类。并使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中对象相似度较小。算法假设:均方误差是计算群组分散度的最佳参数。算法输入:聚类个数k;
2014-07-27 16:59:49 7406
原创 红黑树详解(一)
红黑树是一种自平衡二叉查找树,是在计算机科学中用到的一种数据结构,典型的用途是实现关联数组。它是在1972年由Rudolf Bayer发明的,他称之为"对称二叉B树",它现代的名字是在 Leo J. Guibas 和 Robert Sedgewick 于1978年写的一篇论文中获得的。它是复杂的,但它的操作有着良好的最坏情况运行时间,并且在实践中是高效的: 它可以在O(log n)时间
2014-05-16 16:26:12 1331
转载 你可能没听过的 Java 8 中的 10 个特性
你以前听到的谈论关于Java8的所有都是围绕lambda表达式. 但它仅仅是Java8的一部分. Java 8 有许多新特性---一些强大的新类和语法, 还有其他的从一开始就应该具有的东西.我将要介绍我认为值得了解的10个精华特性. 它们中最少也会有一个或两个你想要试一试, 所以我们开始吧!--zxp翻译于 14天前0人顶顶 翻译的不错哦!
2014-05-15 12:29:02 1293
原创 安卓自学笔记(二)wrap_content和fill_parent的区别
wrap_content:组件的大小以能装入其内容即可; . fill_parent:组件会显示得和其父组件一样大,并填充剩余的空间(在 API Level 8中命名为match_parent)。
2014-05-10 01:33:00 2960
原创 lex语法分析器
Lex是LEXical compiler的缩写,是Unix环境下非常著名的工具,主要功能是生成一个词法分析器(scanner)的C源码,描述规则采用正则表达式(regular expression)。描述词法分析器的文件*.l,经过lex编译后,生成一个lex.yy.c 的文件,然后由C编译器编译生成一个词法分析器。词法分析器,简单来说,其任务就是将输入的各种符号,转化成相应的标识符(toke
2014-04-24 10:32:47 4346
原创 如何在邮件正文显示自己的简历
1、在word左上角点击“另存为”,在弹出的窗口中把那满载你希望的简历转成“网页(*.htm;*.html)”,如下图 2、用记事本打开转格式后的简历,如下图操作,ctrl+A,ctrl+C将你看到的代码一字不漏地复制 3、登录邮箱后,打开写信状态下所有的功能,你会发现红色圈里的按钮,按下去,出现如 之类的东西,当做看不见,不要删。如图: 4、把刚才复制的代码
2014-03-20 13:21:36 5696
原创 Struts2从入门到精通(一)Struts2概述
struts2是一个基于MVC模式的Java EE技术Web开发框架。什么是MVC模式呢?MVC模式即model-view-controller模式(模型-视图-控制器模式),一般来说,用JavaBean作为模型,JSP页面作为视图,Servlet作为控制器。 Struts2可以使用Java EE技术的Web项目开发进行代码的分层,有利于维护。Struts2的优点主要体现在解耦(解耦
2014-01-19 15:39:56 1184
原创 去掉word中过多回车换行的小窍门
博主要翻译一篇英文的论文,想把PDF中的文本内容复制到google翻译中去,首先要把PDF转成word。当然转的方法有很多,想直接转的可以移步https://www.pdftoword.com 或者下载专门的转换工具。 不过我们难免会遇到一篇文章中回车换行过多的情况,比如:过多的回车符是不是会让你看着别扭呢?word里提供的“查找替换”可以解决这个问题。
2014-01-18 15:06:21 4270
原创 eclipse VS netbeans
现在Java流行的IDE不外乎eclipse、netbeans、IntelliJ三种。eclipse和netbeans哪个好用呢?就个人来说还是比较倾向于eclipsenetbeans的一些缺点:1.不能向外拷贝文件。eclipse则支持这个功能。2.没有列编辑。使用过UE的同学都应该知道列编辑的好用之处,eclipse从3.4开始支持列编辑(alt+shift+a);netb
2014-01-16 21:41:14 2640
原创 项目管理习题及解答
一、单项选择题 1.责任分配矩阵是能够明确表示出项目团队成员在组织中的()的一种工具。 A.责任、权力和义务 B.职责、权限和利益 C.关系和作用 D.关系、责任和地位 2.责任分配矩阵将人员配备工作与()联系起来,且表明项目成员在组织中的关系、责任和地位。 A.工作分解结构B.项目组织结构 C.工作流程D.合同结构 3.通常情况下,责任分配矩
2014-01-08 13:40:59 7259
转载 JSP中System.out.println()与out.println()区别
out.println()输出到客户端。 在out.println()中,out是response的实例,是以response为对象进行流输出的,即将内容输出到客户端。如果在JSP页面中使用System.out.println(),在客户端只会输出一个空格。System.out.println()打印在控制台当中。 System.out.println()用的是标准输出流
2013-12-28 21:29:46 2797 1
转载 10 大怪异的编程语言
人们都认为编程语言很容易使用和学习。编程语言应该给你提供数据结构让你来解决实际问题,它们的语法也应清晰明了,容易理解且执行速度快,没有任何bug。但有时候编程语言设计者们会创建一些违背这些原则的语言,要么供研究使用要么纯属娱乐。下面是10种最怪异的最不切实际的编程语言。 1)LOLCODE很少有编程语言像LOLCODE这样注入了这么多网络时代的成分(译者注:LOLCODE是一种建立
2013-12-26 22:17:15 1768
原创 声音文件大小的计算方法
声卡对声音的处理质量可以用三个基本参数来衡量,即采样频率、采样位数和声道数。采样频率是指单位时间内的采样次数。采样频率越大,采样点之间的间隔就越小,数字化后得到的声音就越逼真,但相应的数据量就越大。声卡一般提供11.025kHz、22.05kHz和44.1kHz等不同的采样频率。 采样位数是记录每次采样值数值大小的位数。采样位数通常有8bits或16bits两种,采样位数越大,所能记录声音的变
2013-12-21 23:21:13 10441 1
原创 Mysql中Date()函数的用法
DATE() 函数返回日期或日期/时间表达式的日期部分。实例假设我们有如下的表:OrderIdProductNameOrderDate1'Computer'2008-12-29 16:25:46.635我们使用下面的 SELECT 语句:SELECT ProductName, DATE(OrderDate) AS Or
2013-12-10 14:51:02 2645
原创 从字符串中提取数字 java
随便一个含有数字的字符串,比如:String s="eert343dfg56756dtry66fggg89dfgf";怎么把其中的数字提取出来呢?import java.util.*;public class get_StringNum { public static void main(String[] args) { String str = "l
2013-12-10 14:48:00 2323
原创 java 和 jsp 中弹出对话框的方法
java 和 jsp中弹出对话框的方法。java中: function ale() {alert("hello world"); }jsp中:alert("hello word!");
2013-12-10 14:37:11 3962
原创 文本框默认显示内容点击后消失的方法
点击文本框后默认文字消失,焦点离开输入框默认文字又出现。<INPUT TYPE="TEXT" size="18" value="默认内容"onfocus= "if (value =='这是默认的内容') {value =''}" onblur= "if (value=='') {value='这是默认的内容'}">
2013-12-09 21:48:56 6167
原创 eclipse中jar包中源码Source not found的解决办法
博主最近在开发一个小系统的时候,出现了一个问题。程序中导入的包比如org.apeche.action.ActionForm报错,提示找不到相应的包。可我明明从网上下了相应的包放进工程WEB-INF/ib目录下,在网上查找了资料才知道是因为没有指定jar包所对应的源码位置,因此,只要将jar包和它对应的源码位置配置好,就可以了。第一步:右键点击你的项目,选择“Properties ->
2013-12-07 00:12:24 16419
原创 Ubuntu12.04的汉化
博主装上了Ubuntu12.04后进入系统才发现是英文版,看着挺费劲的,所以需要汉化一下。本文适用于ubuntu 12.04英文版的系统。1.进入ubuntu系统,在顶部齿状标志找到system2.在personal找到Language Support3.进入Language Support后,在language的页面中点击Install/Remove Languages...
2013-12-01 23:21:17 1444
用随机森林的方法对IRIS进行训练和分类
2014-12-02
js 按钮不响应怎么解决
2013-06-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人