- 博客(3)
- 收藏
- 关注
原创 数据挖掘-数据预处理的简单流程
此流程是一种简单的写法,在其他具体问题分析时,需有自己的分析方法,具体情况具体分析。查看train_data与test_data 的个特征列的直方图分布情况,去掉分布特差的特征(分布特别不一致的那种)。# 标准化后数据可视化for col in data_minmax.columns:plt.figure()plt.title(col)seaborn.distplot(data_mi...
2018-12-23 13:49:45 1799
原创 记常用的sklearn库的使用(1)
本篇只只在使用,不记载原理,当字典用。排版不是很好,可以使用搜索ctrl+FPCA主成成分分析from sklearn.decomposition import PCA # 主成分分析算法pca = PCA(n_components= 5) # 选择成分5个pca.fit(X_train) # 训练XX_train = pca.fit_transform(X_train)在使用真是...
2018-12-10 10:20:09 503 2
原创 python-pyplot直方图,标注直方图数据
话不多说。由于自己一直忘记直方图的一些细节,经常不用,老得百度,干脆自己记下来好了。这是直方图的写法与标注直方图的数据写法。如下from matplotlib import pyplot as pltx = range(1,11)y = [84,87,78,93,26,88,74,92,69,86]fig, ax = plt.subplots()# 截尾平均数means = su...
2018-12-09 22:08:50 21625 7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人