![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 72
joycyf
你好
展开
-
重拾机器学习4 apriori
import osimport pandas as pdimport sys# data_folder = os.path.join(os.path.expanduser('~'), 'Data', 'ml-100k') os.path.expanduser(path) #把path中包含的"~"和"~user"转换成用户目录dir_path = 'D:\\study\\python...原创 2019-10-17 21:50:41 · 172 阅读 · 0 评论 -
重拾机器学习3 随机森林及网格搜索
import pandas as pdfrom collections import defaultdictfrom sklearn.model_selection import cross_val_score, train_test_splitfrom sklearn.tree import DecisionTreeClassifierimport numpy as npfrom s...原创 2019-10-15 20:39:30 · 665 阅读 · 0 评论 -
重拾机器学习2 决策树
# coding=utf-8import pandas as pdfrom collections import defaultdictfrom sklearn.model_selection import cross_val_score, train_test_splitfrom sklearn.tree import DecisionTreeClassifierimport num...原创 2019-10-15 16:54:48 · 257 阅读 · 0 评论 -
重拾机器学习1 KNN
import csvimport osimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import cross_val_scorefro...原创 2019-10-11 22:19:59 · 151 阅读 · 0 评论 -
异常值分析
异常值分析简单统计量分析3σ原则箱型图分析箱型图分析代码简单统计量分析可以先对变量做一个描述性统计,进而查看哪些数据是不合理的。最常用的统计量是最大值和最小值,用来判断这个变量的取值是否超出了合理的范围。如客户年龄的最大值为199岁,则该变量的取值存在异常。3σ原则如果数据服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过3倍标准差的值。在正态分布的假设下,距离平均值...原创 2019-06-26 16:08:33 · 1038 阅读 · 0 评论 -
Hands-On Machine Learning with Scikit-Learn and TensorFlow第二章 (1)
第二章:端到端的机器学习project作为一个组织能力强的你,首先第一件事就是拿出你的机器学习项目检查清单:勾勒出问题的框架(什么问题,怎么解决,性能衡量指标)得到数据发现数据准备数据对比每个模型的好坏微调你的模型,奖他们组成一个很好的解决方案展示你的解决方案启动,监视和维护你的系统让我们以加利福利亚房价预测开始吧(数据集可在github下载)简单看下数据集组成import pandas as p...原创 2018-05-28 21:19:50 · 672 阅读 · 0 评论 -
Adaboost算法原理分析和实例(简明易懂)
Adaboost算法原理分析和实例(简明易懂) 【尊重原创,转载请注明出处】 http://blog.csdn.net/guyuealian/article/details/70995333 本人最初了解AdaBoost算法着实是花了几天时间,才明白他的基本原理。也许是自己能力有限吧,很多资料也是看得懵懵懂懂。网上找了一下关于Adaboost算法原理分析,大都是你复制我,我摘抄你,反正我...转载 2018-05-22 20:43:00 · 5432 阅读 · 1 评论 -
ADASYN: 自适应综合过采样
1. 引言 不平衡数据一直是数据挖掘领域最具挑战的几个问题之一。由于多数类的样本在总样本占据的比重太多,少数类样本被忽视,训练出来的分类器更偏向于多数类导致分类器的性能下降。在实际生活中更是有着举足轻重的影响,比如电路电压急速上升,没有发生危险的情况报警没有什么影响,如果发生了危险还没有报警的话危害极大。2.研究现状 Synthetic Minority Oversampling ...原创 2018-05-07 16:25:27 · 27114 阅读 · 4 评论 -
MWMOTE:带多数类权重的少数类样本过采样
比较新的论文引用较少,网上具体的算法介绍就更少,这里我就当为自己做了一些烂笔头的工作。有什么错误的地方恳请指正MWMOTE全称—Majority Weighted MinorityOversampling Technique for ImbalancedData Set Learning这篇论文是一篇IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERI...原创 2018-05-11 16:22:07 · 4750 阅读 · 3 评论 -
Safe-Level-SMOTE:安全级别过采样
最近在看过采样的方法时看到Safe-Level-SMOTE这篇论文,论文全称为《Safe-Level-SMOTE Safe-Level-Synthetic Minority Over-Sampling TEchnique for Handling the Class Imbalanced Problem》看到网上对这种算法介绍的博客比较少,特此留篇见解。有什么理解错误的地方恳请指正。这篇论文给...原创 2018-04-26 19:42:38 · 3188 阅读 · 13 评论