- 博客(6)
- 收藏
- 关注
原创 kfold cross_validate Stratified KFold StratifiedKFold 和 StratifiedShuffleSplit 交叉验证方法
from sklearn.model_selection import train_test_split,cross_val_score,cross_validate # 交叉验证所需的函数from sklearn.model_selection import KFold,LeaveOneOut,LeavePOut,ShuffleSplit # 交叉验证所需的子集划分方法from sklear...
2020-01-29 22:41:55 744
原创 自己记录 渔船 数据 分析
import pandas as pdimport os#usr/bin/python3.4-- coding: utf-8 --df = pd.read_csv(r’E:\machineLearning\data\fishing\hy_round1_train_20200102\0.csv’,encoding=‘utf8’,engine=‘python’)path = r’E:\mac...
2020-01-25 23:21:05 1144
原创 朴素贝叶斯模型
朴素贝叶斯模型,全称为:Naive Bayesian Model,Naive 能翻译为朴素,已经是很高看它了,因为我们知道naive的含义如下:naive: marked by or showing unaffected simplicity and lack of guile or worldly experience;它是简单的,它是缺乏worldly experience的。正如它的名...
2020-01-15 11:39:17 325
原创 机器学习的一些基础问题
参考:http://kubicode.me/2015/08/16/Machine%20Learning/Common-Interview/?from=singlemessage#http://blog.csdn.NET/heyongluoyao8/article/details/49429629http://lib.csdn.Net/article/machinelearning/33798...
2020-01-14 23:40:55 288
原创 使用 Pandas 对机器学习 数据 进行预处理 分类型 进行 连续数据归一化 和 离散数据编码
Pandasread_csv ()df.columns.tolist() #获取所有的列名字df.dtypes.value_counts() # 有多少数据类型统计Select_dtypes 连续数据和离散数据的 分拆str_list = df.select_dtypes(include=[‘object’])print(str_list.columns) #encode...
2020-01-07 15:40:17 664
原创 机器学习的评价方法 Recall Metric ROC
分类问题1.1 混淆矩阵(Confusion Matrix)矩阵中的每一行代表实例的预测类别,每一列代表实例的真实类别。真正(True Positive , TP):被模型预测为正的正样本。假正(False Positive , FP):被模型预测为正的负样本。假负(False Negative , FN):被模型预测为负的正样本。真负(True Negative , TN):被模型...
2020-01-06 16:49:31 1194
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人