机器学习
时代在召唤r
时代在召唤r
展开
-
神经网络和机器学习基础入门分享
转自 https://blog.csdn.net/eastmount/article/details/49591349最近在做知识图谱实体对齐和属性对齐中,简单用了下Word2vec谷歌开源代码。Word2vec是一个将单词表征成向量的形式,它可以把文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 Word2vec采用CBOW(Conti...转载 2018-07-12 10:10:22 · 3104 阅读 · 0 评论 -
文本聚类算法总结
一、文本聚类定义 文本聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导航的重要手段。 二、算法分类 1、划分法(基于划分的聚类算法) 给定一个有N个元组或者纪录...转载 2019-03-01 14:30:03 · 14215 阅读 · 0 评论 -
准确率与召回率
1、两个最常见的衡量指标是“准确率(precision)”(你给出的结果有多少是正确的)和“召回率(recall)”(正确的结果有多少被你给出了) 这两个通常是此消彼长的(trade off),很难兼得。很多时候用参数来控制,通过修改参数则能得出一个准确率和召回率的曲线(ROC),这条曲线与x和y轴围成的面积就是AUC(ROC Area)。AUC可以综合衡量一个预测模型的好坏,这一个...转载 2019-03-20 18:48:41 · 793 阅读 · 0 评论 -
基于Text-CNN模型的中文文本分类实战
转自https://cloud.tencent.com/developer/article/1335257 Text-CNN 1.文本分类 转眼学生生涯就结束了,在家待就业期间正好有一段空闲期,可以对曾经感兴趣的一些知识点进行总结。 本文介绍NLP中文本分类任务中核心流程进行了系统的介绍,文末给出一个基于Text-CNN模型在搜狗新闻数据集上二分类的Demo。 文本分类是自...转载 2019-03-21 11:06:17 · 8341 阅读 · 0 评论