自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 kfold cross_validate Stratified KFold StratifiedKFold 和 StratifiedShuffleSplit 交叉验证方法

from sklearn.model_selection import train_test_split,cross_val_score,cross_validate # 交叉验证所需的函数from sklearn.model_selection import KFold,LeaveOneOut,LeavePOut,ShuffleSplit # 交叉验证所需的子集划分方法from sklear...

2020-01-29 22:41:55 744

原创 自己记录 渔船 数据 分析

import pandas as pdimport os#usr/bin/python3.4-- coding: utf-8 --df = pd.read_csv(r’E:\machineLearning\data\fishing\hy_round1_train_20200102\0.csv’,encoding=‘utf8’,engine=‘python’)path = r’E:\mac...

2020-01-25 23:21:05 1144

原创 朴素贝叶斯模型

朴素贝叶斯模型,全称为:Naive Bayesian Model,Naive 能翻译为朴素,已经是很高看它了,因为我们知道naive的含义如下:naive: marked by or showing unaffected simplicity and lack of guile or worldly experience;它是简单的,它是缺乏worldly experience的。正如它的名...

2020-01-15 11:39:17 325

原创 机器学习的一些基础问题

参考:http://kubicode.me/2015/08/16/Machine%20Learning/Common-Interview/?from=singlemessage#http://blog.csdn.NET/heyongluoyao8/article/details/49429629http://lib.csdn.Net/article/machinelearning/33798...

2020-01-14 23:40:55 288

原创 使用 Pandas 对机器学习 数据 进行预处理 分类型 进行 连续数据归一化 和 离散数据编码

Pandasread_csv ()df.columns.tolist() #获取所有的列名字df.dtypes.value_counts() # 有多少数据类型统计Select_dtypes 连续数据和离散数据的 分拆str_list = df.select_dtypes(include=[‘object’])print(str_list.columns) #encode...

2020-01-07 15:40:17 664

原创 机器学习的评价方法 Recall Metric ROC

分类问题1.1 混淆矩阵(Confusion Matrix)矩阵中的每一行代表实例的预测类别,每一列代表实例的真实类别。真正(True Positive , TP):被模型预测为正的正样本。假正(False Positive , FP):被模型预测为正的负样本。假负(False Negative , FN):被模型预测为负的正样本。真负(True Negative , TN):被模型...

2020-01-06 16:49:31 1194

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除