自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 交叉验证中cv=? 与 cv=KFold(n_splits=?)的区别

这几天复习交叉验证的时候发现一个问题,学习资料中有些地方用的函数中cv=?,有些地方则用的cv=KFold(n_splits=?) 这个函数,就比如我用KNN模型做十折交叉验证:model = sk_neighbors.KNeighborsClassifier(n_neighbors=5,n_jobs=1) #KNN分类import sklearn.model_selection as sk_model_selectionaccs=sk_model_selection.cross_val_score(

2020-08-19 18:31:39 4813

原创 PCA和LDA调库降维过程

之前的PCA小白实战是利用numpy实现PCA过程,这里实现PCA和LDA实际调库应用在数据集的过程。PCA(主成分分析)最大方差理论:信号具有较大的方差,噪声具有较小的方差 PCA的目标:新坐标系上数据的方差越大越好 PCA是无监督的学习方法,直接食用skleran.decomposition即可from sklearn.decomposition import PCApca = PCA(n_components='mle',whiten=False,svd_solver='auto')pca.

2020-08-19 17:57:58 304 1

转载 OpenCV 中x,y,height, width,rows,cols 区别

opencv中图像的x,y 坐标以及 height, width,rows,cols 他们的关系经常混淆。rows 其实就是行,一行一行也就是y 啦。height高度也就是y啦。cols 也就是列,一列一列也就是x啦。width宽度也就是x啦。本文链接:https://blog.csdn.net/u012192662/article/details/41846259...

2020-08-18 19:18:48 900 1

原创 出现 module ‘pandas.core‘ has no attribute ‘categorical‘ 错误

原因:新库更改了调用操作:categorical 改成 dtypes ,比如将if type(df[by].unique()) == pd.core.categorical.Categorical:改为if type(df[by].unique()) == pd.core.dtypes.dtypes:

2020-08-12 12:08:06 614

原创 变量关系可视化展示

做数据分析前的可视化展示非常重要,因为即使能直接调用库,但一些画图参数还是要调,就比较麻烦,这里总结一下最近用到的模板,以后可以直接画图调用。其实官网matplotlib和seaborn的可视化教程做的非常好,有时间一定要亲手打出来过一遍,链接如下:CATEGORICAL X CATEGORICALHeat map of contingency tableMultiple bar plotsCATEGORICAL X CONTINUOUSBox plots of continuous for

2020-08-12 12:05:05 722

原创 出现 No module named ‘sklearn.cross_validation’ 错误

原因:sklearn中已经废弃cross_validation,将其中的内容整合到model_selection操作:cross_validation改成model_selection,比如将from sklearn.cross_validation import KFoldfrom sklearn.cross_validation import cross_val_score改为from sklearn.model_selection import KFoldfrom sklearn.mod

2020-08-11 16:40:17 540

原创 出现 ‘DataFrame’ object has no attribute ‘ix’ 错误

原因:新库对名称变化操作:ix改成loc比如将admissions.ix[0:128, "fold"] = 1改为admissions.loc[0:128, "fold"] = 1错误来源于 逻辑回归实战 入学接收问题https://blog.csdn.net/qq_43653405/article/details/107655246

2020-08-11 16:37:32 39037 5

原创 出现 DataFrame object has no attribute ‘as_matrix‘ 错误

原因:新库删去了as_matrix操作df.as_matrix()改成df.values,比如将data = data.as_matrix(columns = None) 改为data = data.values错误来源于 简单的用户流失预警实战https://blog.csdn.net/qq_43653405/article/details/107875825...

2020-08-11 16:32:27 2708

原创 出现 ‘Series‘ object has no attribute ‘reshape‘ 错误

原因:需要更详细的分类reshape函数操作:添加 .values,如将sample = sample.reshape([10, 10])改为sample = sample.values.reshape([10, 10])错误来自于探索性数据分析初探:https://blog.csdn.net/qq_43653405/article/details/107916619...

2020-08-10 22:48:23 1410 1

原创 出现No module named ‘pandas.tools‘错误

原因:新库不支持旧库的接口操作:将tool.plotting改成plotting,如from pandas.tools.plotting import scatter_matrix改成from pandas.plotting import scatter_matrix错误来源自 探索性数据分析初探https://blog.csdn.net/qq_43653405/article/details/107916619...

2020-08-10 22:44:10 2761 2

原创 探索性数据分析初探

这里记录一下利用搜集到的数据:足球运动员数据集,进行具体任务前的探索性数据分析,自己觉得是干货,再做其他分析的时候一些函数可以当做模板,代码是挑出来比较典型的,不是流程式的。目标:探索性数据分析(EDA). 挑战目标: 这些裁判在给红牌的时候咋想的呢,会不会被跟球员的肤色有关?数据简介:数据包含球员和裁判的信息,2012-2013年的比赛数据,总共设计球员2053名,裁判3147名,特征列表如下:– https://docs.google.com/document/d/1uCF5wmbcL9

2020-08-10 22:23:21 283

原创 Anaconda下配置opencv问题总结

因为OpenCV最新版不支持一些库和接口,需要在anaconda中重新创建python3.6环境使用以前的OpenCV-3.4.1.15版本,下载网址在最下面,只支持python3.6版本amd64位系统。并总结一下忘记操作和方法。知识总结创建新环境举例conda create -n py36 python=3.6 anaconda查看所有环境conda info --env激活某一环境举例conda activate py36退出环境,或回到base环境conda deactivate

2020-08-08 20:01:16 478

原创 简单的用户流失预警实战

现实情况下有很多游戏公司给回归用户发礼包、打电话,这里做一个类似的用户流失预警,有助于公司或厂商做出反应。记录一下学习过程,方便以后复习和查找资料。开始先导入库,数据from __future__ import divisionimport pandas as pdimport numpy as npchurn_df = pd.read_csv('churn.csv')col_names = churn_df.columns.tolist() #取所有特征print("Column na

2020-08-08 10:52:56 474

原创 贷款利润最大化实战

拿到一批贷款数据,现在对其进行分类建立模型,看之后的人人来了,我能不能贷给他钱。记录实战的流程,方便以后复习、查找。特征删除数据量极大,大概有几十个特征四万多条数据,这时很明显要进行初步的特征删除。import pandas as pdloans_2007 = pd.read_csv('LoanStats3a.csv', skiprows=1)#先对数据做一下变换,删除几列没用的half_count = len(loans_2007) / 2loans_2007 = loans_2007.dr

2020-08-06 00:05:11 359

原创 简单的股票预测实战(利用ARIMA))

利用ARIMA模型对股票的收盘价进行预测先导入库并设置画图参数%matplotlib inlineimport pandas as pd#import pandas_datareader 获取各种数据集库import datetimeimport matplotlib.pylab as pltimport seaborn as snsfrom matplotlib.pylab import stylefrom statsmodels.tsa.arima_model import ARIMA

2020-08-05 19:19:32 2871 5

原创 ARIMA 小白实战初探

记录利用时间序列模型 ARIMA(p,d,q)进行顾客满意度的预测。ARIMA模型建立流程:平稳序列(差分法确定d)p和q阶数的确定(ACF和PACF)ARIMA(p,d,q)导入库并设置一些画图参数from __future__ import absolute_import, division, print_function%load_ext autoreload%autoreload 2%matplotlib inline%config InlineBackend.figur

2020-08-05 18:22:34 336 1

apache-tomcat-7.0.109.exe

古董版,Tomcat 7.0,官网已经下不到了,需要自取

2021-07-06

arduino.zip

压缩包包括单片机的相关教程和安装程序,教程是从零基础到进阶的。 Arduino 是一块基与开放原始代码的 Simple i/o 平台,並且具有使用类似 java,C 语言的开发环境。

2020-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除