- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 调用sklearn的NB模型来实现文章分类
在上一篇文章里面,我自己手写了一个朴素贝叶斯算法(NB),进行了训练和验证,并且通过在网上随便找一篇文章进行测试,能够正确得到文章类型结果。这篇文章中,我打算采用sklearn库,直接调用NB模型进行训练和预测。1、首先加载sklearn的库;train_test_split--对数据进行分割,分成训练集和测试集。TfidfVectorizer--生成文章单词的TFIDF矩阵。MultinomialNB--sklearn的NB模型。from sklearn.model_selection impo
2020-10-29 15:14:14
719
原创 手写朴素贝叶斯NB算法,对文章进行分类
上篇文章写了对数据的整理和分词,接下来对整理好的数据进行训练,运用的算法先从最简单的NB算法开始,首先说下NB算法的原理。NB算法的公式P(yi|X)= P(X|yi)*P(yi)/P(X),X表示待测的一篇文章,yi表示分类标签,P(yi|X)表示这篇文章属于哪类的概率, P(X|yi)表示为指定类别下产生这篇文章的概率,P(yi)每个类别的先验概率,P(X)这篇文章存在的概率为1。根据极大似然估计,P(X|yi) =ΠP(xi|yi),xi为文章中包含的单词,P(xi|yi)表示为指定类别下文章中每..
2020-10-21 17:57:05
316
原创 文章分类项目前言
最近刚学完大数据的有关知识,刚好下载到一份文章分类的数据库,尝试独立进行文章分类。数据库中的数据,分为14个类别。每个类别中包含多篇文章。接下来将逐步完成文章分类的项目实战,后面会详细介绍应用的知识和算法。...
2020-10-14 14:14:05
119
原创 ffmpeg交叉编译
一、将ffmpeg移植到zcu106开发板中1、下载x264 x265库(如果不用265编解码的话,不需要安装x265库):git clone https://code.videolan.org/videolan/x264.gitgit clone https://code.videolan.org/videolan/x265.git2、下载ffmpeg库:git clone git:/...
2020-02-21 15:51:05
786
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人