![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AI/NLP/机器学习算法
记录和分享人工智能相关的知识。
阿敏Joney
温故而知新,再简单的东西也要亲自手写一遍~~~
展开
-
TextRank算法原理和提取关键词的主要过程详解 & 计算句子相似度 & 计算句子重要性公式
1、TextRank计算句子相似度和句子重要性的公式2、TextRank算法提取关键词的过程3、TextRank建立关键词无向图原创 2019-10-31 17:23:02 · 2376 阅读 · 0 评论 -
nltk安装punkt等语料库时报SSL错误完美解决方案及离线安装方法
nltk是NLP领域中一个比较通用的国际分词工具,但是使用时往往依赖语料库数据包,需要安装到本地,以下介绍在线安装和离线安装两种方式:(ps:对NLP感兴趣的朋友可以相互学习,我的微信号:Joney-Joney,请备注:NLP博客)1.在线安装punkt等数据包:1.1 在线安装时往往会报SSL等安全连接验证错误,可通过python的ssl模块中启用无验证的网络连接方式,代码如下...原创 2019-10-30 18:26:44 · 3774 阅读 · 4 评论 -
分类问题的模型评估指标总结
在分类任务下,预测结果(Predicted Condition)与正确标记(True Condition)之间存在四中不同的组合,构成混淆矩阵(可适用于多分类),通常有这几种主要模型评估指标:精确率(查的准)、召回率(查的全对正样本的区分能力)、F1值(反映模型的稳健性)等。TP:真正例(true positive)FP:伪正例(false positive)TN:真反例(true negat...原创 2019-10-15 15:24:06 · 957 阅读 · 0 评论 -
朴素贝叶斯算法注意事项(有待完善)
1.朴素贝叶斯算法的优缺点总结:优点:朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率; 分类速度快,准确度高; 对缺失数据不太敏感,算法简单,常用于文本分类(如新闻分类,垃圾邮件过滤等)。缺点:由于使用了样本属性独立性的假设,所以如果样本属性有关联时效果不好。2.朴素贝叶斯算法的核心是:特征之间相互独立,每个特征的概率单独计算,互不影响。3.朴素贝叶斯的...原创 2019-10-15 10:51:41 · 1334 阅读 · 0 评论 -
为什么说逻辑回归LR是线性分类器?
问题描述:为什么说逻辑回归LR是非常典型的线性分类器?首先,我们要弄明白区分线性与非线性分类器的标准是什么?是决策边界(Decision Boundary)以二分类(LR可以用于多分类)为例进行说明:逻辑回归的判别式如下图所示:总结:虽然逻辑回归的模型特征经过非线性函数Sigmoid的转换,但是它的决策边界是线性方程,所以逻辑回归LR是非常典型的线性分类器。决策边界的由来:...原创 2019-10-12 11:36:04 · 4657 阅读 · 0 评论 -
PCA算法中样本方差和协方差的无偏估计与n-1的由来
原文出处:http://blog.sina.com.cn/s/blog_c96053d60101n24f.html在PCA算法中的方差协方差计算公式中除数为什么是n-1?假设X为独立同分布的一组随机变量,总体为M,随机抽取N个随机变量构成一个样本,和是总体的均值和方差,是常数。是对样本的均值和方差,由于样本是随机抽取的,也是随机的。既然是随机变量,就可以观察他们的均值方差。...转载 2019-09-30 10:34:08 · 3005 阅读 · 0 评论