自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

转载 numpy的astype函数

astype函数用于array中数值类型转换x = np.array([1, 2, 2.5])x.astype(int)1...

2020-06-30 18:42:34 3441

转载 numpy 的triu及trul 函数以及参数k的解释

import numpy as np  np.triu np.tril例如q=np.triu(np.ones((5,5)), k=0)上面两个函数分别是返回上三角和下三角矩阵的函数,值得说的是参数k。  k表示从第几条对角线起保留数据。 正值是主对角线往上数,负值 是往下数。k=0时表示从主对角线开始保留。下面以5*5矩阵及triu 函数为例,不同的k参数的结果...

2020-06-30 18:27:28 726

转载 pandas中的reset_index()

数据清洗时,会将带空值的行删除,此时DataFrame或Series类型的数据不再是连续的索引,可以使用reset_index()重置索引。import pandas as pdimport numpy as npdf = pd.DataFrame(np.arange(20).reshape(5,4),index=[1,3,4,6,8])print(df) 0 1 2 31 0 1 2 33 4 5 6 74 8 ...

2020-06-29 19:38:38 970

转载 sklearn之模型选择与评估

sklearn之模型选择与评估在机器学习中,在我们选择了某种模型,使用数据进行训练之后,一个避免不了的问题就是:如何知道这个模型的好坏?两个模型我应该选择哪一个...

2020-06-29 14:13:50 801

转载 数据预处理:独热编码(One-Hot Encoding)和 LabelEncoder标签编码

数据预处理:独热编码(One-Hot Encoding)和 LabelEncoder标签编码 </h1> <div class="clear"></div> <div class="postBody"> 一、问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。离散特征的编码分为两种情况:  1、离散特征的取值之间没有大小的意义,比如colo...

2020-06-29 10:09:48 812

转载 非正态分布数据转换成正态分布

常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料性质选择适当的变量变换方法。1. 对数变换即将原始数据X的对数值作为新的分布数据:X’=lgX当原始数据中有小值及零时,亦可取X’=lg(X+1)还可根据需要选用X’=lg(X+k)或X’=lg(k-X)对数变换常用于(1)使服从对数正态分布的数据正态化。如环境中某些污染物的分布,人体中某些微量元素的分布等,可用对数正态...

2020-06-29 09:42:26 3399

转载 深入探讨回归分析的假设条件、散点图以及解决方案

回归分析标志着预测建模的第一步。毫无疑问,回归分析非常容易实现。无论是语法还是其中使用的参数,都没有任何易混淆的。但是,只跑一行代码是无法解决问题的,也不是只看看R² ,MSE值就可以的。回归分析告诉我们的远远不止这些!All models ...

2020-06-29 09:36:52 3538

转载 PRID:行人重识别常用评测指标(rank-n、Precision & Recall、F-score、mAP 、CMC、ROC)

1、rank-n搜索结果中最靠前(置信度最高)的n张图有正确结果的概率。例如: lable为 m1,在100个样本中搜索。如果识别结果是 m1、m2、m3、m4、m5……,则此时rank-1的正确率为100%;rank-2的正确率也为100%;rank-5的正确率也为100%;如果识别结果是 m2、m1、m3、m4、m5……,则...

2020-06-28 09:59:08 1379

原创 牛客网之数据库刷题笔记

Day11.题目:一个表中可能有多个关键字,但在实际的应用中只能选择一个,被选用的关键字称为(主键)候选键(Candidate Key):一个或者多个属性的集合,可以唯一确定实体的一个实例,具有唯一性、最小性;主属性是从候选码中挑出来的一个,候选码可以有多个,因此主属性也可以有多个主键(Primary Key):从候选键中,选中用来作为唯一标识的属性或者属性组被称为主键,主键必须唯一且非空(not null);可选键(Alternative Key):候选键中没有选中的其他键,称为可选键;而表

2020-06-24 20:47:32 2191

转载 深度学习: 学习率 (learning rate)

深度学习: 学习率 (learning rate)Introduction学习率 (learning rate),控制 模型的 学习进度 : lr 即 stride (步长) ,即反向传播算法中的 ηη :ωn←ω...

2020-06-22 21:21:15 1766

转载 五种常用异常值检测方法

Toggle navigation ...

2020-06-22 14:46:37 24131 2

转载 异常值检查与处理

异常值的定义:异常值,即在数据集中存在不合理的值,又称离群点,如下所示:异常值判别方法:1.简单统计法对属性值进行一个描述性的统计,从而查看哪些值是不合理的。比如:对待一个人的身高,不可能说有人的身高出现3m等以上的;如果是能使用图像直接显示数据的话,可以直观的直接直观的从图片中得出异常值2. 3δ原则当数据服从正态分布:根据正态分布的定义可知,距离平均值3δ之外的概率为 P(|x-μ|>3δ) <= 0.003 ,这属于极小概率事件,在默认情况下我们可以认定,距离超过平均值3δ的样

2020-06-22 14:20:48 656

转载 数据预处理之异常值处理

定义:异常值,即在数据集中存在不合理的值,又称离群点。比如年龄为-1,笔记本电脑重量为1吨等,都属于异常值的范围。从集合角度来看,异常值即离群点,如下图所示:...

2020-06-22 14:19:27 1278

转载 Python sklearn错误:Expected 2D array, got scalar array instead…Reshape your data…

Python sklearn错误:Expected 2D array, got scalar array instead…Reshape your data… ...

2020-06-22 13:55:01 1728

转载 python中seed的使用

python中seed的使用 ...

2020-06-22 09:40:34 884

转载 python 中的 scipy.stats 统计分析包,偏度峰度

python 来做统计分析时一般使用 scipy 中的 stats。 numpy 也能生成一定概率分布的随机数,但如果需要更具体的概率密度,累积概率等,就用用到 ...

2020-06-22 09:17:11 1533

转载 常用机器学习算法汇总比较(完)

机器学习入门系列(2)--如何构建一个完整的机器学习项目,第九篇!常用机器学习算法汇总比较的最后一篇,介绍提升(Boosting)算法、GBDT、优化算法和卷积神经网络的基本原理、优缺点。9. 提升(Boosting)方法简述 提升方法(boosting)是一种常用的统计学习方法,在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提供分类的性能。 boosting 和 baggingboosting 和 bagging 都是集成学习(ensemble learning)领域

2020-06-13 15:30:16 799

转载 常用机器学习算法汇总(中)

机器学习入门系列(2)--如何构建一个完整的机器学习项目,第八篇!上一篇文章介绍了线性回归、逻辑回归、决策树和随机森林四种算法,本文会继续介绍四种算法--SVM、朴素贝叶斯、KNN 以及 kmean 算法,其中最后一种是无监督学习的聚类算法,前面三种也是非常常见的算法,特别是 SVM,在 2012 年 AlexNet 网络的成功之前,一直都是图像分类中非常常用的分类算法。5. 支持向量机(SVM)简述定义:SVM 是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便

2020-06-13 15:28:04 292

转载 常用机器学习算法汇总比较(上)

常用机器学习算法汇总比较(上)鑫鑫淼淼焱焱​华南理工大学 电子与通信工程硕士​关注他33 人赞同了该文章机器学习入门系列(2)--如何构建一个完整的机器学习项目,第七篇!前面六篇文章从一个项目的终极目标、寻找和获取数据,到数据预处理,做特征工程,接下来就需要开始选择合适的算法模型,进行训练评估和测试了。所以接下来会整理下比较常用的机器学习算法的汇总比较,包括:线性回归逻辑回归决策树随机森林支持向量机朴素贝叶斯KNN 算法K-均值算法提升方法(Boosting)GBDT优化算法卷积神经网络因为篇幅问题,主要简

2020-06-13 15:25:35 553

转载 估算类问题-费米问题

估算类问题-费米问题 </h1> <div class="clear"></div> <div class="postBody"> 考点  首先,这是属于学术界数量估算中的“费米问题”。  其次,考察候选人的:逻辑思考、分析和心理抗压能力。方法  1. Top-down、Bottom-up例子1. 请你估算一下一...

2020-06-12 14:23:09 1064 1

翻译 各种分类算法比较

各种分类算法比较 ...

2020-06-09 11:00:40 245

转载 Mysql 高级(尚硅谷)

Mysql 高级(尚硅谷) ...

2020-06-03 19:26:56 165

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除