自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

转载 【转】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std  计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。>>> from...

2018-04-30 19:24:38 530

转载 Random Forest(sklearn参数详解)

本篇不是介绍RF的,关于RF网上有很多通俗易懂的解释西瓜书与统计学习方法等很多教材中的解释也都足够本篇仅针对如何使用sklearn中的RandomForestClassifier作记录代码案例:class sklearn.ensemble.RandomForestClassifier(n_estimators=10, crite-rion=’gini’, max_depth=None, m...

2018-04-28 11:20:01 902

转载 sklearn常用分类算法集合

# coding=gbk ''''' Created on 2016年6月4日 @author: bryan ''' import time from sklearn import metrics import pickle as pickle import pandas as pd # Multinomial Naive Ba...

2018-04-28 10:04:01 1806

转载 特征选择算法--Relief与ReliefK

本文转载自:https://blog.csdn.net/ferrarild/article/details/187926131:ReiiefRelief算法最早由Kira提出,最初局限于两类数据的分类问题。Relief算法是一种特征权重算法(Feature weighting algorithms),根据各个特征和类别的相关性赋予特征不同的权重,权重小于某个阈值的特征将被移除。Relief算法中特...

2018-04-25 11:04:19 1619

原创 numpy数组 randint,normal以及 c_函数功能

1:random.randint(low,high,size) : 包含low。不包含high,size是数量,默认为12:np.random.normal()正态分布高斯分布的概率密度函数              numpy中numpy.random.normal(loc=0.0, scale=1.0, size=None)  参数的意义为:  loc:float  概率分布的均值,对应着整个...

2018-04-22 18:50:24 799

原创 pycharm 安装第三方库报错:AttributeError: 'module' object has no attribute 'main'

准备运行一份代码,是python2环境,需要pycharm配置到python2:本机环境如下:prcharm版本 2017.3.4python2.7 用pycharm 的虚拟环境加载第三方库的时候,例如numpy,直接报错:AttributeError: 'module' object has no attribute 'main'如图:Traceback (most recent call la...

2018-04-20 22:28:19 9007 1

转载 coo_matrix

转载自:博客coo_matrix:构造矩阵,指定位置填数据这个就更容易了。直接上例子如下:即n行,m列存了data[i],其余位置皆为0.>>> from scipy.sparse import coo_matrix>>> coo_matrix((3, 4), dtype=np.int8).toarray()array([[0, 0, 0, 0], ...

2018-04-19 15:36:21 756

原创 numpy reshape -1参数

reshape是对array重新塑型,但是今天看别人代码出现了np.reshape(z,[-1])这种参数,仔细看下。按照引用的例子:https://blog.csdn.net/weixin_39449570/article/details/78619196>>> z = np.array([[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12],[1...

2018-04-19 11:24:15 1677

原创 gitHub 代码从fork到push

可以参考:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000https://jingyan.baidu.com/article/359911f5a4fe4b57fe03060d.html?qq-pf-to=pcqq.group参与了某个apach开源项目,用github过程中发现一些...

2018-04-17 17:29:26 3777

转载 python list 排序问题

转载自:https://blog.csdn.net/huangzhiyuan111/article/details/52667791对List进行排序,Python提供了两个方法---sort----方法1.用List的内建函数list.sort进行排序list.sort(func=None, key=None, reverse=False) 方法2.用序列类型函数sorted(list)进行排序...

2018-04-08 12:25:21 313

原创 推荐系统Surprise--度量准则与评估标准

一:Surprise中基于近邻的方法(协同过滤)可以设定不同的度量准则。具体如下:相似度度量标准度量标准说明1:cosine用户(items)之间的cosine 相似度2:msd用户(items)之间的均方差误差3:pearson用户(items)之间的皮尔逊相关系数4:pearson_baseline计算用户(item)之间的(缩小的)皮尔逊相关系数,使用基准值进行居中而不是平均值。1:cosi...

2018-04-08 11:12:49 2099

原创 推荐系统Surprise库内置推荐算法

在推荐系统的建模过程中,我们将用到python库 Surprise(Simple Python RecommendatIon System Engine),是scikit系列中的一个。简单易用,同时支持多种推荐算法:基础算法/baseline algorithms基于近邻方法(协同过滤)/neighborhood methods矩阵分解方法/matrix factorization-based (...

2018-04-07 20:43:06 4947 1

原创 python3.6--filter()函数与python2的区别

python函数在python3,6中返回值是<filter at 0xf9d9a10cf8>,而在python2中返回值类型是list

2018-04-07 14:51:05 684

转载 从python中copy与deepcopy的区别看python引用

转载:博客讨论copy与deepcopy的区别这个问题要先搞清楚python中的引用、python的内存管理。python中的一切事物皆为对象,并且规定参数的传递都是对象的引用。可能这样说听起来比较难懂,对比一下PHP中的赋值和引用就有大致的概念了。参考下面一段引用:1. python不允许程序员选择采用传值还是传引用。Python参数传递采用的肯定是“传对象引用”的方式。实际上,这种方式相当于传...

2018-04-06 22:26:54 195

原创 推荐系统--Surprise模型选择模块selection moudle

Surprise库中  The model_selection package  提供了算法的交叉验证和参数选择功能1:交叉验证迭代器 (类似于scikit-learn)KFold基础k折交叉验证RepeatedKFold 多次k折交叉验证.ShuffleSplit乱序训练集和数据集下的基础交叉验证LeaveOneOut在测试集上每个用户只取一个评分做交叉验证PredefinedKFold:数据集...

2018-04-06 13:22:22 1448

原创 推荐系统---surprise库的测试

1:加载数据集def load_format2trainset(): file_path = "F:\\ML\\recommendation_data\\music_playlist_farmat.txt" # 指定文件格式 reader = Reader(line_format='user item rating timestamp', sep=',') # 从文...

2018-04-05 15:36:34 2261 1

转载 python参数传递是值传递还是引用传递

先举个栗子: def func(val): val.append(100) val = ['x', 'y', 'z'] return val L = [1, 10]print func(L)print L输出结果:  ['x', 'y', 'z']                [1, 10, 100]为什么呢?我们接下来讲下Python函数的参数传递我们首先明确一...

2018-04-04 10:33:51 1236

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除