自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 调用sklearn的NB模型来实现文章分类

在上一篇文章里面,我自己手写了一个朴素贝叶斯算法(NB),进行了训练和验证,并且通过在网上随便找一篇文章进行测试,能够正确得到文章类型结果。这篇文章中,我打算采用sklearn库,直接调用NB模型进行训练和预测。1、首先加载sklearn的库;train_test_split--对数据进行分割,分成训练集和测试集。TfidfVectorizer--生成文章单词的TFIDF矩阵。MultinomialNB--sklearn的NB模型。from sklearn.model_selection impo

2020-10-29 15:14:14 719

原创 手写朴素贝叶斯NB算法,对文章进行分类

上篇文章写了对数据的整理和分词,接下来对整理好的数据进行训练,运用的算法先从最简单的NB算法开始,首先说下NB算法的原理。NB算法的公式P(yi|X)= P(X|yi)*P(yi)/P(X),X表示待测的一篇文章,yi表示分类标签,P(yi|X)表示这篇文章属于哪类的概率, P(X|yi)表示为指定类别下产生这篇文章的概率,P(yi)每个类别的先验概率,P(X)这篇文章存在的概率为1。根据极大似然估计,P(X|yi) =ΠP(xi|yi),xi为文章中包含的单词,P(xi|yi)表示为指定类别下文章中每..

2020-10-21 17:57:05 316

原创 第一部数据整理和分词

拿到分类好的文章数据后,对数据库进行整理。将所有文章汇聚到一起,格式为:标签/t内容;

2020-10-16 15:09:42 316

原创 文章分类项目前言

最近刚学完大数据的有关知识,刚好下载到一份文章分类的数据库,尝试独立进行文章分类。数据库中的数据,分为14个类别。每个类别中包含多篇文章。接下来将逐步完成文章分类的项目实战,后面会详细介绍应用的知识和算法。...

2020-10-14 14:14:05 119

原创 ffmpeg交叉编译

一、将ffmpeg移植到zcu106开发板中1、下载x264 x265库(如果不用265编解码的话,不需要安装x265库):git clone https://code.videolan.org/videolan/x264.gitgit clone https://code.videolan.org/videolan/x265.git2、下载ffmpeg库:git clone git:/...

2020-02-21 15:51:05 786 1

max5821电路及其程序

max5841数模转换器做的电流源!里面包含proteus仿真图和程序代码。

2014-05-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除