自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Claire的专栏

Data Science

  • 博客(6)
  • 收藏
  • 关注

原创 皮尔逊相关系数Pearson Correlation Coefficient

Pearson相关性系数可以看出是升级版的欧氏距离平方,因为它提供了对于变量取值范围不同的处理步骤。因此对不同变量间的取值范围没有要求(unit free),最后得到的相关性所衡量的是趋势,而不同变量量纲上差别在计算过程中去掉了,等价于z-score标准化。而未经升级的欧式距离以及cosine相似度,对变量的取值范围是敏感的,在使用前需要进行适当的处理。在低维度可以优先使用标准化后的欧式距离或者...

2020-02-14 21:30:48 1532

转载 Note: Python中的*重复运算符

在python中有个特殊的符号“*”,可以用做数值运算的乘法算子,也是用作对象的重复算子,但在作为重复算子使用时一定要注意注意的是:*重复出来的各对象具有同一个id,也就是指向在内存中同一块地址,在对各个对象进行操作是一定要注意。举例来说:alist = [range(3)]*4alist[[0, 1, 2], [0, 1, 2], [0, 1, 2], [0, 1, 2]]上面初始化一个二层列表用来模拟矩阵,该矩阵式4X3的,为描述方便,这里记矩阵为A。现在我想给A11赋值为1,用下面

2020-07-20 18:31:54 367

原创 python深拷贝和浅拷贝的区别

首先深拷贝和浅拷贝都是对象的拷贝,都会生成一个看起来相同的对象,他们本质的区别是拷贝出来的对象的地址是否和原对象一样,也就是地址的复制还是值的复制的区别。什么是可变对象,什么是不可变对象:可变对象是指,一个对象在不改变其所指向的地址的前提下,可以修改其所指向的地址中的值;不可变对象是指,一个对象所指向的地址上值是不能修改的,如果你修改了这个对象的值,那么它指向的地址就改变了,相当于你把这个对象指向的值复制出来一份,然后做了修改后存到另一个地址上了,但是可变对象就不会做这样的动作,而是直接在对象所指的地

2020-06-12 13:30:32 142

原创 Statistics for Data Analysis

Why statisticsWhat is statistics?Statistics is the discipline that studiesthe procedure of collection, illustration(explain or prove), processing and analysis of the datahow to extract informat...

2020-02-11 10:32:37 544

原创 Jupyter Notebook

1.mac安装Jupyter Notebook终端输入pip install jupyter2.启动Jupyter1) 在终端,先cd到源代码文件目录(想要存放的Jupyter源代码目录)然后输入jupyter notebook终端会启动一个web服务,网页地址:http://localhost:8888/?token=b0d62c4a89c7e84e68be06198df971a751...

2020-02-08 11:34:39 334

原创 MySQL数据删改代码

2019-12-31 15:38:36 137

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除