MachineLearning
文章平均质量分 72
狮子HH
且将新火试新茶,诗酒趁年华!
展开
-
有趣的数学--Catalan Number
Introduction上午在给本科生上习题课时遇到这样一个问题:n个元素进栈有多少个出栈顺序?在计算机中,栈操作要遵循先进后出和后进先出的规则,就像压弹匣一样。设有n个元素,其出栈顺序为f(n),则: f(1)=1; f(2)=2; //12,21 f(3)=5; //123,132,321,213,231 (312--该顺序不存在) f(4)=14;原创 2015-10-29 21:57:08 · 1216 阅读 · 0 评论 -
weka数据准备
将matlab中的数组数据保存为weka使用的.arff格式的数据:1:先将matlab中的数组数据保存为.csv格式的数据 matlab命令:csvwrite('filename',matrixname)2:用文本编辑软件打开.csv文件,在第一行添加上各列的属性名,各个属性名之间用逗号分隔3:将.csv格式的数据转换成.arff格式的数据1)打开Weka Gui Chooser,在Tools里原创 2015-06-02 11:31:11 · 951 阅读 · 0 评论 -
k近邻算法
k近邻算法《机器学习实战》学习总结一言以蔽之计算待分类点与训练集中每个点之间的距离,选取前k个最近的点, 其中出现频率最高的类别就是待分类点的类别。伪代码1.计算训练集中的点到当前点之间的距离; 2.安装距离递增顺序排序; 3.选取与当前点距离最小的k个点; 4.确定前k个点所在类别的出现频率; 5.返回前k个点出现频率最高的类别作为当前点的预测分类。Pros & Cons优点:精度高,对原创 2015-12-13 15:09:24 · 862 阅读 · 0 评论 -
机器学习常见算法分类汇总
转自@王萌,有少许修改。机器学习起源于人工智能,可以赋予计算机以传统编程所无法实现的能力,比如飞行器的自动驾驶、人脸识别、计算机视觉和数据挖掘等。 机器学习的算法很多。很多时候困惑人们的是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。学习方式将算法按照学习方式分类可以让人们在建模和算法选择的时候考虑能转载 2016-03-02 22:28:30 · 7860 阅读 · 0 评论 -
范数
在线性代数中, 范数( norm)是一个表示“长度”概念的函数,为向量空间内的所有向量赋予非零的正长度或大小。对于一个n维的向量 x,常见的范数有:向量的范数 一个向量的0范数指的是其非零元素的个数; 一个向量的1范数指的是其元素绝对值之和; 一个向量的2范数指的是其模长,即元素平方和的开方。矩阵的范数 矩阵的范数有很多种形式,这里我们定义其p-范数为:原创 2016-03-05 16:19:35 · 685 阅读 · 0 评论 -
奥卡姆剃刀原理
这个原理称为”如无必要,勿增实体”,即”简单有效原理”。 正如他在《箴言书注》中所说”切勿浪费较多东西去做用较少的东西同样可以做好的事情。”当你有两个处于竞争地位的理论能得出同样的结论,那么简单的那个更好。这一表述也有一种更为常见的强形式:如果你有两个原理,它们都能解释观测到的事实,那么你应该使用简单的那个,直到发现更多的证据。 对于现象最简单的解释往往比比较复杂的解释更正确。原创 2016-03-05 16:02:58 · 2373 阅读 · 0 评论 -
实例详解机器学习
实例详解机器学习如何解决问题 美团点评技术团队前言 随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题。我们结合美团在机器学习上的实践,进行一个实战(InAction)系列的介绍(带“机器学习InAction系转载 2016-03-05 22:43:44 · 827 阅读 · 0 评论 -
分类器评价指标
混淆矩阵 Confusion MatrixAccuracy = (TP+TN)/(TP+FP+TN+FN) ;Precision = TP/(TP+FP);Recall = TP/(TP+FN);F1-score = 2*Precision*Recall/(Precision + Recall);Specificity = TN/(FP+TN);ROC(Receiver Operatin原创 2015-07-09 11:44:29 · 1338 阅读 · 1 评论 -
中文情感分析之TextCNN
中文情感分析之TextCNN综述情感分析方法基于情感词典的情感分析基于机器学习算法的情感分析文本分类模型TextCNN中文情感分析实践数据预处理文本数值化模型构建结果分析总结最近接了个业务需求,需要对论坛发帖进行情感分析,以便于对恶意发帖的行为进行审核治理。在此对情感分析方法进行一个总结,并重点介绍下文本分类基准模型TextCNN在中文情感分析中的实践应用。综述情感分析(Sentiment...原创 2019-08-24 08:00:52 · 11959 阅读 · 3 评论