自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

平平淡淡,戒急用忍,一生学闭嘴。

平平淡淡,戒急用忍,一生学闭嘴。

  • 博客(30)
  • 资源 (2)
  • 收藏
  • 关注

转载 github代码搜索技巧

github代码搜索技巧

2019-11-27 22:08:54 185

原创 模型评估

机器学习模型评估指标汇总机器学习之模型评估Python机器学习笔记:常用评估模型指标的用法

2019-11-26 14:12:13 115

原创 如何优雅的在 Microsoft word中插入代码

[word里写代码1[](http://www.planetb.ca/syntax-highlight-word)]word里写代码2

2019-11-26 01:42:31 133

原创 好文章

使用sklearn优雅地进行数据挖掘使用sklearn做单机特征工程使用Python进行描述性统计机器学习中,有哪些特征选择的工程方法?

2019-11-25 15:01:51 99

原创 OneHotEncoder独热编码和 LabelEncoder标签编码——机器学习

学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。首先了解机器学习中的特征类别:连续型特征和离散型特征拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用logistic回归,w1x1+w2x2,因为x1的取值太大了,...

2019-11-25 13:33:40 285

原创 常用公共数据集

https://blog.csdn.net/orDream/article/details/91606597https://blog.csdn.net/u010429424/article/details/72171476#actionhttps://blog.csdn.net/weixin_41036461/article/details/80667690

2019-11-24 15:16:44 594

原创 Git代码托管平台

GitHub地址:https://github.com/Gitlab地址:https://about.gitlab.com/bitbucket地址:https://bitbucket.org/开源中国代码托管地址:http://git.oschina.net/coding.net地址:https://coding.net/home.htmlhttps://code.csdn.net/...

2019-11-24 01:05:30 419

转载 XGBoost、LightGBM的详细对比介绍

https://www.cnblogs.com/infaraway/p/7890558.html

2019-11-23 03:27:19 112

原创 Type I and type II errors | 第一类错误和第二类错误

https://blog.csdn.net/weixin_34226182/article/details/86400139https://blog.csdn.net/akon_wang_hkbu/article/details/77776486https://blog.csdn.net/dgyuanshaofeng/article/details/78686117https://blog....

2019-11-23 01:22:49 1478

原创 回归评价指标MSE、RMSE、MAE、R-Squared

前言分类问题的评价指标是准确率,那么回归算法的评价指标就是MSE,RMSE,MAE、R-Squared。下面一一介绍均方误差(MSE)MSE (Mean Squared Error)叫做均方误差。看公式这里的y是测试集上的。用 真实值-预测值 然后平方之后求和平均。猛着看一下这个公式是不是觉得眼熟,这不就是线性回归的损失函数嘛!!! 对,在线性回归的时候我们的目的就是让这个损失函数最小...

2019-11-23 00:31:16 1247

原创 热力图和相关系数分析

数据分析在机器学习中非常重要,它决定后续的特征值选取和数据处理的方向。热力图(heatmap)和相关性(correlation)分析则是常见的分析手段,本文主要介绍两者的使用方法,文中使用的演示代码放在GitHub中。热力度热力度常常用来表示地图上的分布密度,也可以简单理解为两维坐标中的数值到颜色的映射图。我们来看下面的热力度,去掉方格中颜色后,其实就是一个二维矩阵皮尔森相关系数相关性最...

2019-11-23 00:02:39 37516 1

原创 代价敏感的学习方法

代价敏感的学习方法是机器学习领域中的一种新方法,它主要考虑在分类中,当不同的分类错误会导致不同的惩罚力度时如何训练分类器。例如在医疗中,“将病人误诊为健康人的代价”与“将健康人误诊为病人的代价”不同;在金融信用卡盗用检测中,“将盗用误认为正常使用的代价”与将“正常使用误认为盗用的代价”也不同。通常,不同的代价被表示成为一个N×N的矩阵Cost中,其中N 是类别的个数。Cost[i, j]表示将一个...

2019-11-22 23:55:16 11192 1

原创 1.gcForest 包安装和集成学习方法的 Python 实现2.minepy安装方法(Windows版本)

https://cloud.tencent.com/developer/article/1020343https://github.com/pylablanche/gcForesthttps://blog.csdn.net/xiangxianghehe/article/details/72811188https://github.com/kingfengji/gcForesthttps:/...

2019-11-22 16:19:40 984

原创 anaconda切换盘符以及手动安装包

1.在win环境下安装的Anaconda,打开其提供的Anaconda Prompt窗口,默认路径是你的用户名2.解决方法是首先切到C盘根目录下:3.后再切换到你的指定目录的盘符,再切换到你指定路径下,即可成功:...

2019-11-22 15:49:48 1891

原创 probit概率单位回归分析

SPSS学习笔记9:probit概率单位回归分析http://www.datasoldier.net/archives/614http://www.sohu.com/a/256543537_655370statahttps://blog.csdn.net/arlionn/article/details/84943212

2019-11-22 13:05:12 3551

原创 逻辑数据库

https://www.cnblogs.com/sap-ronny/articles/8461823.html

2019-11-20 16:04:12 404

原创 机器学习

https://blog.csdn.net/CoderPai/article/details/78807606

2019-11-20 15:45:00 87

原创 有这一篇机器学习全够了

https://blog.csdn.net/np4rHI455vg29y2/article/details/79549560https://www.douban.com/note/722184475/?type=likehttps://www.cnblogs.com/baby-lily/p/10680617.htmlhttps://www.cnblogs.com/LBSer/p/460590...

2019-11-20 15:43:36 104

原创 深度学习

https://www.csdn.net/gather_28/MtTaggysNjM2OC1ibG9n.html

2019-11-18 12:46:51 108

原创 遗传算法

根据提取的特征个数确定遗传算法中个体的长度,然后随机产生二进制种群,1代表有这个特征,0代表没有这个特征,然后根据这些特征进行svm训练与测试,用svm的分类精度作为适应度值,然后进行迭代,直到达到最大迭代次数,输出最优的分类精度和其对应的染色体,染色体中为1 的位置就是我们所要选择的特征。https://www.zhihu.com/question/23293449https://www.j...

2019-11-17 19:18:05 284

原创 集成学习

一、集成学习法在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些方面表现的比较好)。集成学习就是组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型,集成学习潜在的思想是即便某一个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来。集成方法是将几种机器学习技术组合...

2019-11-17 15:23:52 239

原创 191115-2

smote:https://blog.csdn.net/march_on/article/details/48650237特征工程代码模板:http://www.shataowei.com/2017/12/01/python%E5%BC%80%E5%8F%91%EF%BC%9A%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B%E4%BB%A3%E7%A0%81%E6%...

2019-11-15 22:08:44 171

原创 191115

遗传算法1遗传算法2rapidminer这个网站有账号,可以看:https://www.analyticsvidhya.com/

2019-11-15 16:49:22 94

原创 python从入门到实践回顾——字典

字典alien_0 = {'color': 'green', 'points': 5}alien_0['color']'green'alien_0['points']5alien_1 = {'color': 'green'}new_points = alien_0['points']print("You just earned " + str(new_points) ...

2019-11-13 00:49:47 158

原创 visual studio2019许可证

许可证:Visual Studio 2019 EnterpriseBF8Y8-GN2QH-T84XB-QVY3B-RC4DFVisual Studio 2019 ProfessionalNYWVH-HT4XC-R2WYW-9Y3CM-X4V3Y

2019-11-12 21:31:06 6824

原创 如何免费使用数据挖掘软件RapidMiner - 申请学生许可证

如果你是一名在校学生,有校园邮箱,是可以免费使用RapidMiner的全部功能的,方法如下:-首先登录官网 https://rapidminer.com,注册账户,Account Type 需要选择 Educational,然后就可以有1年的使用资格(可以使用全部功能),到期后再重新申请即可。rapidminer使用教程:https://docs.rapidminer.com/...

2019-11-11 16:47:58 1217

原创 资源191111

https://github.com/leiguorui/programming-video-tutorials

2019-11-11 15:00:31 85

原创 java问题:错误: 找不到或无法加载主类 HelloWorld

有时候我们需要直接用jdk提供的java命令来执行class文件让软件运行起来,特别是很多初学者,但经常会发现如下提示:D:\java\eclipse-workspace\first\src\first>java HelloWorld错误: 找不到或无法加载主类 HelloWorld解决:1.java执行class文件是根据CLASSPATH指定的地方来找,不是我们理解当前目录。如...

2019-11-11 01:15:25 2840

原创 python实现一个抽象数据结构:栈

2019-11-06 00:38:35 255

原创 类和对象

class Cat: #类名命名规则是驼峰状的 #属性: #方法:方法参数里一定有self def __init__(self,newColor,newWeight,newTail):#创建完对象以后,一定会调用的方法,恢复到出厂设置 #当创建完一个对象后,立马会自动调用 #添加属性 self.color=n...

2019-11-05 23:25:45 119

SAS University Edition:Windows安装指南.pdf

SAS下载及安装指南,可劲薅。。。SAS engages industry analysts for their recommendations on our software, messaging and other market and competitive information. Analyst firms offer advice and research, through their publications, events and consulting projects, to companies that are evaluating technology purchases.

2020-07-15

尚硅谷MySql核心技术.txt

工具、视频、代码、笔记 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件之一。 MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。 MySQL所使用的 SQL 语言是用于访问数据库的最常用标准化语言。MySQL 软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择 MySQL 作为网站数据库。 由于其社区版的性能卓越,搭配 PHP 和 Apache 可组成良好的开发环境。

2019-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除