2020年01月_SamWang_333

08月 07月 04月 01月

原创 kfold cross_validate Stratified KFold StratifiedKFold 和 StratifiedShuffleSplit 交叉验证方法

from sklearn.model_selection import train_test_split,cross_val_score,cross_validate # 交叉验证所需的函数from sklearn.model_selection import KFold,LeaveOneOut,LeavePOut,ShuffleSplit # 交叉验证所需的子集划分方法from sklear...

2020-01-29 22:41:55 744

原创自己记录渔船数据分析

import pandas as pdimport os#usr/bin/python3.4-- coding: utf-8 --df = pd.read_csv(r’E:\machineLearning\data\fishing\hy_round1_train_20200102\0.csv’,encoding=‘utf8’,engine=‘python’)path = r’E:\mac...

2020-01-25 23:21:05 1144

原创朴素贝叶斯模型

朴素贝叶斯模型，全称为：Naive Bayesian Model，Naive 能翻译为朴素，已经是很高看它了，因为我们知道naive的含义如下：naive: marked by or showing unaffected simplicity and lack of guile or worldly experience;它是简单的，它是缺乏worldly experience的。正如它的名...

2020-01-15 11:39:17 325

原创机器学习的一些基础问题

参考：http://kubicode.me/2015/08/16/Machine%20Learning/Common-Interview/?from=singlemessage#http://blog.csdn.NET/heyongluoyao8/article/details/49429629http://lib.csdn.Net/article/machinelearning/33798...

2020-01-14 23:40:55 288

原创使用 Pandas 对机器学习数据进行预处理分类型进行连续数据归一化和离散数据编码

Pandasread_csv （）df.columns.tolist() #获取所有的列名字df.dtypes.value_counts() # 有多少数据类型统计Select_dtypes 连续数据和离散数据的分拆str_list = df.select_dtypes(include=[‘object’])print(str_list.columns) #encode...

2020-01-07 15:40:17 664

原创机器学习的评价方法 Recall Metric ROC

分类问题1.1 混淆矩阵（Confusion Matrix）矩阵中的每一行代表实例的预测类别，每一列代表实例的真实类别。真正(True Positive , TP)：被模型预测为正的正样本。假正(False Positive , FP)：被模型预测为正的负样本。假负(False Negative , FN)：被模型预测为负的正样本。真负(True Negative , TN)：被模型...

2020-01-06 16:49:31 1194

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 kfold cross_validate Stratified KFold StratifiedKFold 和 StratifiedShuffleSplit 交叉验证方法

原创 自己记录 渔船 数据 分析

原创 朴素贝叶斯模型

原创 机器学习的一些基础问题

原创 使用 Pandas 对机器学习 数据 进行预处理 分类型 进行 连续数据归一化 和 离散数据编码

原创 机器学习的评价方法 Recall Metric ROC

空空如也

空空如也

原创自己记录渔船数据分析

原创朴素贝叶斯模型

原创机器学习的一些基础问题

原创使用 Pandas 对机器学习数据进行预处理分类型进行连续数据归一化和离散数据编码

原创机器学习的评价方法 Recall Metric ROC