![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习常用算法
Data_Machine
这个作者很懒,什么都没留下…
展开
-
自编码器理解
自编码器如果给定一个神经网络,我们假设其输出与输入是相同的,然后训练调整其参数,得到每一层中的权重。自然地,我们就得到了输入的几种不同表示(每一层代表一种表示),这些表示就是特征。自动编码器就是一种尽可能复现输入信号的神经网络。为了实现这种复现,自动编码器就必须捕捉可以代表输入数据的最重要的因素,就像PCA那样,找到可以代表原信息的主要成分。具体过程如下:1)给定无标签数据,用非监督方转载 2017-11-10 10:15:28 · 813 阅读 · 0 评论 -
SVM文本分类实验过程
1、分词,打标签;2、特征选择: 卡方检验def chi_select():#构建停用词表 stopwords=[] with open("../hlt_stop_words.txt","r") as stopword: for line in stopword: #遍历文件,一行行遍历,读取文本 rs = line.rep...原创 2018-08-02 10:59:51 · 2209 阅读 · 0 评论 -
xgboost应用于C++项目
xgboost的分类效果优于SVM,CNN等,它具有R语言和python的接口,但没有C++接口,因此需要对xgboost源码进行编译,并应用到C++项目中。xgboost源码编译具体步骤如下:1、下载旧版xgboost,最新版不含有C++源码及xgboost.sln;2、用VS打开Windows中的xgboost.sln,首先编译rabit,将会生成rabit.lib文件;3、编译x...原创 2019-06-28 16:54:47 · 2997 阅读 · 0 评论