- 博客(30)
- 资源 (2)
- 收藏
- 关注
原创 如何优雅的在 Microsoft word中插入代码
[word里写代码1[](http://www.planetb.ca/syntax-highlight-word)]word里写代码2
2019-11-26 01:42:31 133
原创 OneHotEncoder独热编码和 LabelEncoder标签编码——机器学习
学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。首先了解机器学习中的特征类别:连续型特征和离散型特征拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用logistic回归,w1x1+w2x2,因为x1的取值太大了,...
2019-11-25 13:33:40 285
原创 常用公共数据集
https://blog.csdn.net/orDream/article/details/91606597https://blog.csdn.net/u010429424/article/details/72171476#actionhttps://blog.csdn.net/weixin_41036461/article/details/80667690
2019-11-24 15:16:44 594
原创 Git代码托管平台
GitHub地址:https://github.com/Gitlab地址:https://about.gitlab.com/bitbucket地址:https://bitbucket.org/开源中国代码托管地址:http://git.oschina.net/coding.net地址:https://coding.net/home.htmlhttps://code.csdn.net/...
2019-11-24 01:05:30 419
原创 Type I and type II errors | 第一类错误和第二类错误
https://blog.csdn.net/weixin_34226182/article/details/86400139https://blog.csdn.net/akon_wang_hkbu/article/details/77776486https://blog.csdn.net/dgyuanshaofeng/article/details/78686117https://blog....
2019-11-23 01:22:49 1478
原创 回归评价指标MSE、RMSE、MAE、R-Squared
前言分类问题的评价指标是准确率,那么回归算法的评价指标就是MSE,RMSE,MAE、R-Squared。下面一一介绍均方误差(MSE)MSE (Mean Squared Error)叫做均方误差。看公式这里的y是测试集上的。用 真实值-预测值 然后平方之后求和平均。猛着看一下这个公式是不是觉得眼熟,这不就是线性回归的损失函数嘛!!! 对,在线性回归的时候我们的目的就是让这个损失函数最小...
2019-11-23 00:31:16 1247
原创 热力图和相关系数分析
数据分析在机器学习中非常重要,它决定后续的特征值选取和数据处理的方向。热力图(heatmap)和相关性(correlation)分析则是常见的分析手段,本文主要介绍两者的使用方法,文中使用的演示代码放在GitHub中。热力度热力度常常用来表示地图上的分布密度,也可以简单理解为两维坐标中的数值到颜色的映射图。我们来看下面的热力度,去掉方格中颜色后,其实就是一个二维矩阵皮尔森相关系数相关性最...
2019-11-23 00:02:39 37516 1
原创 代价敏感的学习方法
代价敏感的学习方法是机器学习领域中的一种新方法,它主要考虑在分类中,当不同的分类错误会导致不同的惩罚力度时如何训练分类器。例如在医疗中,“将病人误诊为健康人的代价”与“将健康人误诊为病人的代价”不同;在金融信用卡盗用检测中,“将盗用误认为正常使用的代价”与将“正常使用误认为盗用的代价”也不同。通常,不同的代价被表示成为一个N×N的矩阵Cost中,其中N 是类别的个数。Cost[i, j]表示将一个...
2019-11-22 23:55:16 11192 1
原创 1.gcForest 包安装和集成学习方法的 Python 实现2.minepy安装方法(Windows版本)
https://cloud.tencent.com/developer/article/1020343https://github.com/pylablanche/gcForesthttps://blog.csdn.net/xiangxianghehe/article/details/72811188https://github.com/kingfengji/gcForesthttps:/...
2019-11-22 16:19:40 984
原创 anaconda切换盘符以及手动安装包
1.在win环境下安装的Anaconda,打开其提供的Anaconda Prompt窗口,默认路径是你的用户名2.解决方法是首先切到C盘根目录下:3.后再切换到你的指定目录的盘符,再切换到你指定路径下,即可成功:...
2019-11-22 15:49:48 1891
原创 probit概率单位回归分析
SPSS学习笔记9:probit概率单位回归分析http://www.datasoldier.net/archives/614http://www.sohu.com/a/256543537_655370statahttps://blog.csdn.net/arlionn/article/details/84943212
2019-11-22 13:05:12 3551
原创 有这一篇机器学习全够了
https://blog.csdn.net/np4rHI455vg29y2/article/details/79549560https://www.douban.com/note/722184475/?type=likehttps://www.cnblogs.com/baby-lily/p/10680617.htmlhttps://www.cnblogs.com/LBSer/p/460590...
2019-11-20 15:43:36 104
原创 遗传算法
根据提取的特征个数确定遗传算法中个体的长度,然后随机产生二进制种群,1代表有这个特征,0代表没有这个特征,然后根据这些特征进行svm训练与测试,用svm的分类精度作为适应度值,然后进行迭代,直到达到最大迭代次数,输出最优的分类精度和其对应的染色体,染色体中为1 的位置就是我们所要选择的特征。https://www.zhihu.com/question/23293449https://www.j...
2019-11-17 19:18:05 284
原创 集成学习
一、集成学习法在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些方面表现的比较好)。集成学习就是组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型,集成学习潜在的思想是即便某一个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来。集成方法是将几种机器学习技术组合...
2019-11-17 15:23:52 239
原创 191115-2
smote:https://blog.csdn.net/march_on/article/details/48650237特征工程代码模板:http://www.shataowei.com/2017/12/01/python%E5%BC%80%E5%8F%91%EF%BC%9A%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B%E4%BB%A3%E7%A0%81%E6%...
2019-11-15 22:08:44 171
原创 python从入门到实践回顾——字典
字典alien_0 = {'color': 'green', 'points': 5}alien_0['color']'green'alien_0['points']5alien_1 = {'color': 'green'}new_points = alien_0['points']print("You just earned " + str(new_points) ...
2019-11-13 00:49:47 158
原创 visual studio2019许可证
许可证:Visual Studio 2019 EnterpriseBF8Y8-GN2QH-T84XB-QVY3B-RC4DFVisual Studio 2019 ProfessionalNYWVH-HT4XC-R2WYW-9Y3CM-X4V3Y
2019-11-12 21:31:06 6824
原创 如何免费使用数据挖掘软件RapidMiner - 申请学生许可证
如果你是一名在校学生,有校园邮箱,是可以免费使用RapidMiner的全部功能的,方法如下:-首先登录官网 https://rapidminer.com,注册账户,Account Type 需要选择 Educational,然后就可以有1年的使用资格(可以使用全部功能),到期后再重新申请即可。rapidminer使用教程:https://docs.rapidminer.com/...
2019-11-11 16:47:58 1217
原创 java问题:错误: 找不到或无法加载主类 HelloWorld
有时候我们需要直接用jdk提供的java命令来执行class文件让软件运行起来,特别是很多初学者,但经常会发现如下提示:D:\java\eclipse-workspace\first\src\first>java HelloWorld错误: 找不到或无法加载主类 HelloWorld解决:1.java执行class文件是根据CLASSPATH指定的地方来找,不是我们理解当前目录。如...
2019-11-11 01:15:25 2840
原创 类和对象
class Cat: #类名命名规则是驼峰状的 #属性: #方法:方法参数里一定有self def __init__(self,newColor,newWeight,newTail):#创建完对象以后,一定会调用的方法,恢复到出厂设置 #当创建完一个对象后,立马会自动调用 #添加属性 self.color=n...
2019-11-05 23:25:45 119
SAS University Edition:Windows安装指南.pdf
2020-07-15
尚硅谷MySql核心技术.txt
2019-08-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人