![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
_张小凡
这个作者很懒,什么都没留下…
展开
-
pyspark使用jieba.analyse报错IOError: [Errno 20] Not a directory:
问题:jieba打包zip后上传spark运行jieba.analyse包中tfidf报错:IOError: [Errno 20] Not a directory: 'XXXX/jieba.zip/jieba/analyse/idf.txt'解决方案:修改analyse包下的tf_idf.py如下(代码参考自:https://github.com/fxsjy/jieba/pull/539/files):# encoding=utf-8from __future__ import ab原创 2020-08-20 11:37:01 · 1076 阅读 · 0 评论 -
对线性回归,logistic回归和一般回归的认识
【转载时请注明来源】:http://www.cnblogs.com/jerrylead JerryLead 2011年2月27日 作为一个机器学习初学者,认识有限,表述也多有错误,望大家多多批评指正。1 摘要 本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题,回归属于有监督学习转载 2015-03-23 15:13:09 · 351 阅读 · 0 评论 -
【决策树】— C4.5算法建立决策树JAVA练习
转载出处:http://www.cnblogs.com/lixusign/archive/2012/06/13/2548124.html以下程序是我练习写的,不一定正确也没做存储优化。有问题请留言交流。转载请挂连接。当前的属性为:age income student credit_rating当前的数据集为(最后一列是TARGET_VALUE):转载 2015-03-31 23:51:41 · 722 阅读 · 0 评论 -
LR(逻辑回归)
本系列文章用于汇集知识点,查漏补缺,面试找工作之用。数学公式较多,解释较少。1.假设2.sigmoid函数:3.假设的含义:4.性质:5.找一个凸损失函数6.可由最大似然估计推导出单个样本正确预测的概率为只是3两个式子合并在一起的表示方法整个样本空间的概率分布为取转载 2015-03-18 23:52:21 · 471 阅读 · 0 评论 -
余弦距离、欧氏距离和杰卡德相似性度量的对比分析
文章出处:http://www.cnblogs.com/chaosimple/archive/2013/06/28/3160839.html1、余弦距离余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。向量,是多维空间中有方向的线段,如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。而要确定两转载 2015-04-13 21:12:20 · 514 阅读 · 0 评论 -
决策树的剪枝理论
文章出处:http://blog.sina.com.cn/s/blog_4e4dec6c0101fdz6.html剪枝理论,决策树的剪枝在上一节中没有仔细讲,趁这个机会学习了剪枝的基础理论,这里会详细学习。决策树为什么(WHY)要剪枝?原因是避免决策树过拟合(Overfitting)样本。前面的算法生成的决策树非常详细并且庞大,每个属性都被详细地加以考虑转载 2015-04-20 21:16:14 · 820 阅读 · 0 评论 -
WEKA使用教程
目录 1. 简介2. 数据格式3.数据准备4. 关联规则(购物篮分析)5. 分类与回归6. 聚类分析1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名转载 2015-04-21 15:38:11 · 431 阅读 · 0 评论 -
个人推荐的Weka教程,包含了数据格式、数据准备、分类和聚类Demo
出处:http://irwenqiang.iteye.com/blog/1308834WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到 同时weka也是新西兰的一种鸟名,转载 2015-04-21 15:32:59 · 633 阅读 · 0 评论