- 博客(7)
- 收藏
- 关注
原创 特征工程之特征预处理-文本特征
import pandas as pdimport numpy as npimport reimport nltk #pip install nltk#jieba构造一个文本数据集corpus = ['The sky is blue and beautiful.', 'Love this blue and beautiful sky!', 'T...
2019-09-30 11:45:16
452
原创 特征工程之特征预处理-数值特征
离散值处理import pandas as pdimport numpy as npvg_df = pd.read_csv('datasets/vgsales.csv', encoding = "ISO-8859-1")vg_df[['Name', 'Platform', 'Year', 'Genre', 'Publisher']].iloc[1:7] ...
2019-09-30 11:44:47
546
原创 特征工程之特征预处理-图像特征
import skimageimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom skimage import io#opencv tensorflow%matplotlib inline图像shapecat = io.imread('./datasets/cat.png')dog = ...
2019-09-30 11:44:03
241
原创 特征工程之特征预处理_0
from sklearn.preprocessing import StandardScaler, MinMaxScaler, RobustScalerimport numpy as npimport pandas as pdnp.set_printoptions(suppress=True)简单小数据views = pd.DataFrame([1295., 25., 19000., ...
2019-09-30 11:43:44
130
原创 pandas常用操作
pandas 25 式目录**查看 pandas 及其支持项的版本创建 DataFrame重命名列反转行序反转列序按数据类型选择列把字符串转换为数值优化 DataFrame 大小用多个文件建立 DataFrame ~ 按行用多个文件建立 DataFrame ~ 按列从剪贴板创建 DataFrame把 DataFrame 分割为两个随机子集根据多个类别筛选 DataFr...
2019-09-29 17:37:28
1053
原创 python机器学习分类算法之决策树
第一步:导包import numpy as np from sklearn.model_selection import train_test_split from sklearn import tree from sklearn.metrics import accuracy_score, auc, confusion_matrix, f1_score, precision_s...
2018-09-12 21:47:16
426
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人