![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
£•€•×
这个作者很懒,什么都没留下…
展开
-
路漫漫其修远兮,吾将上下而求索 fbprophet
安装包真心累1,pip install fbprophet 报错2.conda install fbprophet 报错3.conda install -c conda-forge fbprophet 报错4.conda install fbprophet -c conda-forge原创 2020-06-20 07:55:59 · 267 阅读 · 0 评论 -
pandas.read_csv参数整理
pandas.read_csv参数整理读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.LocalPath or any object with a read() method (such as a file hand原创 2020-06-03 15:10:47 · 113 阅读 · 0 评论 -
word2vec之CBOW模型
word2vec之CBOW模型CBOW模型CBOW模型最后输出10万维,解决问题:层次softmaxSkip-gram模型inner原创 2020-06-02 18:01:58 · 179 阅读 · 0 评论 -
提高类不平衡数据的分类准确率
提高类不平衡数据的分类准确率二分类数据(训练集分布)过抽样 oversampling欠抽样 Under-sampling逻辑阈值移动Threshold-moving组合方法Ensemble techniques二分类数据(训练集分布)过抽样 oversampling对正元组再采样,直到训练集的正例与负例数量相同欠抽样 Under-sampling减少负元组的数量,随机地从负类删除元组,直到训练集的正例与负例数量相同逻辑阈值移动Threshold-moving修改模型,移动决策阈值设定,使得原创 2020-05-14 10:58:14 · 510 阅读 · 0 评论 -
提升分类准确率之随机森林
随机森林随机森林First-RIFirst-RC#随机森林随机森林=决策树+随机属性随机森林每个分类器为一个决策树:每个结点采用随机选择的属性进行划分分类时返回得票最多的类First-RI随机输入选择形成的随机森林有放回地采样得到训练集:在每个节点堆积选择F个属性作为该结点的属性CART算法增长树基尼指数,增长到最大规模,不剪枝。其中,F远小于可用属性数First-RC输入属性的随机线性组合在每个节点,随机选择L个原属性,以【-1,1】中随机选取的数为系数相加,创建F个线性组合的新原创 2020-05-12 16:06:44 · 5412 阅读 · 0 评论 -
提高分类准确率之boosting提升法
提高分类准确率之boosting提升法boosting提升Adaboostboosting提升1.在提升方法中,权重赋予每个训练元组,迭代地学习k个分类器。2.学习得到分类器Mi之后,更新权重,使得其后的分类器Mi+1更关注Mi无分类的训练元组,最终提升的分类器M组合每个个体分类器的表决,其中每个分类器投票的权重是其准确率的函数Adaboost算法Adaboost一种提升算法-创建分类器的组合,每个给出一个加权投票 输入: D:类标记的训练元组集; k:轮数(每轮产生一个分类器) 一种分原创 2020-05-12 15:52:08 · 419 阅读 · 0 评论 -
提高分类准确率的技术之袋装法
提高分类准确率的技术袋装法Bagging袋装法Bagging算法:袋装-为学习方案创建组合分类模型,其中每个模型给出等权重预测输入:D:d个训练元组的集合k:组合分类器中的模型书;一种学习方案(决策树、后向传播等)输出:组合分类器-复合模型方法:1.for i =1 to k do #创建k个模型2.通过对D有放回抽样,创建自助样本Di;3.使用Di和学习方法导出Mi;4.endfor使用组合分类器对元组X分类并返回多数表决优点:1.袋装分类器的准确率通常显著高于从原训练集原创 2020-05-12 15:03:53 · 878 阅读 · 0 评论