自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ZJC的博客

热爱数据,热爱技术

  • 博客(7)
  • 收藏
  • 关注

转载 特征工程系列(理论)下-特征预处理

添加链接描述

2019-09-30 11:55:10 151

原创 特征工程之特征预处理-文本特征

import pandas as pdimport numpy as npimport reimport nltk #pip install nltk#jieba构造一个文本数据集corpus = ['The sky is blue and beautiful.', 'Love this blue and beautiful sky!', 'T...

2019-09-30 11:45:16 452

原创 特征工程之特征预处理-数值特征

离散值处理import pandas as pdimport numpy as npvg_df = pd.read_csv('datasets/vgsales.csv', encoding = "ISO-8859-1")vg_df[['Name', 'Platform', 'Year', 'Genre', 'Publisher']].iloc[1:7] ...

2019-09-30 11:44:47 546

原创 特征工程之特征预处理-图像特征

import skimageimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom skimage import io#opencv tensorflow%matplotlib inline图像shapecat = io.imread('./datasets/cat.png')dog = ...

2019-09-30 11:44:03 241

原创 特征工程之特征预处理_0

from sklearn.preprocessing import StandardScaler, MinMaxScaler, RobustScalerimport numpy as npimport pandas as pdnp.set_printoptions(suppress=True)简单小数据views = pd.DataFrame([1295., 25., 19000., ...

2019-09-30 11:43:44 130

原创 pandas常用操作

pandas 25 式目录**查看 pandas 及其支持项的版本创建 DataFrame重命名列反转行序反转列序按数据类型选择列把字符串转换为数值优化 DataFrame 大小用多个文件建立 DataFrame ~ 按行用多个文件建立 DataFrame ~ 按列从剪贴板创建 DataFrame把 DataFrame 分割为两个随机子集根据多个类别筛选 DataFr...

2019-09-29 17:37:28 1053

原创 python机器学习分类算法之决策树

第一步:导包import numpy as np from sklearn.model_selection import train_test_split from sklearn import tree from sklearn.metrics import accuracy_score, auc, confusion_matrix, f1_score, precision_s...

2018-09-12 21:47:16 426 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除