数据挖掘
赴前尘
惜春春去
展开
-
重要链接记录
1.https://www.cnblogs.com/yamin/p/7111397.html # 已安装python的情况下如何安装anaconda原创 2020-05-01 22:53:37 · 194 阅读 · 0 评论 -
pytorch框架使用LSTM预测股票价格
1.代码# -*- coding: utf-8 -*-# @Time : 2020/5/11 11:18import matplotlib.pyplot as pltfrom sklearn.preprocessing import MinMaxScalerimport numpy as npimport tushare as tsimport torchfrom torch import nnDAYS_FOR_TRAIN = 10EPOCHS = 1000class原创 2020-05-11 20:15:25 · 3697 阅读 · 9 评论 -
from torch._C import * dlopen: cannot load any more object with static TLS
1.错误截图:2.解决方法:把torch相关包导入顺序全部放在最上面,如下图原创 2020-05-08 16:56:45 · 781 阅读 · 2 评论 -
keras分别采用全连接神经网络(DNN)和一维卷积神经网络(1D-CNN)对鸢尾花(iris)数据集进行分类及精度对比
from sklearn.model_selection import train_test_splitfrom sklearn.datasets import load_irisfrom sklearn.preprocessing import LabelEncoderimport kerasfrom keras.models import Sequentialfrom keras...原创 2020-04-30 16:28:31 · 2993 阅读 · 7 评论 -
随机森林模型主要参数的调参方法
# -*- coding: utf-8 -*-import pandas as pdimport numpy as npimport lightgbm as lgbfrom sklearn import metricsfrom sklearn.cluster import KMeansfrom sklearn.ensemble import RandomForestClassifie...原创 2019-08-27 18:25:36 · 4374 阅读 · 0 评论 -
stacking多模型融合+交叉验证对鸢尾花数据集进行分类
stacking技术图示:完整代码:# -*- coding: utf-8 -*-from sklearn.datasets import load_irisimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import accuracy_sco...原创 2019-08-27 17:03:08 · 4394 阅读 · 17 评论 -
使用单模型(RandomForestClassifier)stacking技术对鸢尾花数据集进行分类
stacking技术图示:完整代码:# -*- coding: utf-8 -*-from sklearn.datasets import load_irisimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import accuracy_sco...原创 2019-08-27 16:10:01 · 769 阅读 · 0 评论 -
catboost应用于含多个离散特征的数据挖掘多分类问题
# -*- coding: utf-8 -*-import pandas as pdimport numpy as npimport lightgbm as lgbfrom catboost import CatBoostRegressor, CatBoostClassifierfrom sklearn.cluster import KMeansfrom sklearn.featur...原创 2019-08-26 19:14:52 · 4390 阅读 · 0 评论 -
k-means聚类时使用SSE(簇内误方差)进行最优K的选取
# -*- coding: utf-8 -*-import pandas as pdfrom sklearn.cluster import KMeansimport matplotlib.pyplot as plt'''k-means最优K的选取'''data_Path = 'dataset/first_round_training_data.csv'df_features = ...原创 2019-08-24 18:27:18 · 8202 阅读 · 0 评论 -
随机森林模型进行递归特征消除的python实现
核心代码:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.metrics import precision_scorefrom sklearn.metrics import recall_scorefrom sklearn.metrics import f1_scor...原创 2019-08-07 14:44:17 · 7234 阅读 · 14 评论 -
几篇介绍特征工程中特征选取的方法总结的博客
十二种特征工程相关技术简介 :http://blog.itpub.net/29829936/viewspace-2648602/特征工程完全总结:https://blog.csdn.net/leadai/article/details/78527559特征工程之特征选取 :https://www.cnblogs.com/pinard/p/9032759.html...原创 2019-08-02 16:46:42 · 169 阅读 · 0 评论 -
python实现离散特征的 LabelEncoder编码和OneHotEncoder编码
LabelEncoder: xxx为属性名from sklearn.preprocessing import LabelEncoderencoder = LabelEncoder()dataset['xxx'] = encoder.fit_transform(dataset['xxx'])OneHotEncoder:单独特征编码xxx为属性名import pandas ...原创 2019-07-23 18:07:39 · 868 阅读 · 0 评论 -
python通过信息增益的方法进行字符型离散特征之间的相关性分析
参加了一个比赛,关于数据挖掘的多分类问题,特征集中包含了一些离散特征,通过计算信息增益来度量离散特征与目标特征之间的相关性离散特征: accept_from目标特征:CODE代码实现:import pandas as pdimport numpy as np# 信息熵def info_entropy(attr): prob = pd.value_co...原创 2019-07-23 17:21:57 · 2119 阅读 · 1 评论 -
基于Weka的典型数据挖掘应用
实验目标 理解数据挖掘的基本概念,掌握基于Weka工具的基本数据挖掘(分类、回归、聚类、关联规则分析)过程。 实验内容 下载并安装Java环境(JDK 7.0 64位)。 下载并安装Weka 3.7版。 基于Weka的数据分类。 基于Weka的数据回归。 基于Weka的数据聚类。 基于Weka的关联规则分析。 实验步骤 下载并安装Java环境(...原创 2019-07-05 09:24:56 · 4148 阅读 · 5 评论