machine learning in coding（python）：pandas数据包DataFrame数据结构简介

最新推荐文章于 2023-11-18 19:30:00 发布

VIP文章 mmc2015

最新推荐文章于 2023-11-18 19:30:00 发布

阅读量3.1k

点赞数 2

分类专栏： ML in coding machine learning in coding 文章标签： scikit-learn 机器学习 pandas数据包 DataFrame数据结构 machine learning in

本文链接：https://blog.csdn.net/mmc2015/article/details/47304591

版权

导入模块：

import pandas as pd
import numpy as np #pandas依赖于numpy
from sklearn import preprocessing
import xgboost as xgb

常用功能简介：

#load train and test 
train  = pd.read_csv('train.csv', index_col=0)
#index_col=0，指明第1列是索引
test  = pd.read_csv('test.csv', index_col=0)
#type(train)=pandas.core.frame.DataFrame（本质是hash）
#train.head(n)，获取train前n行的数据
#train.head(0)，若n=0，表示获取整个train数据
#train.tail(n)，获取train后n行的数据
#train.describe()，获取train的统计信息，如下：
'''
             Hazard         T1_V1         T1_V2         T1_V3        T1_V10  
count  50999.000000  50999.000000  50999.000000  50999.000000  50999.000000   
mean       4.022785      9.722093     12.847585      3

最低0.47元/天解锁文章

优惠劵

mmc2015

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
machine learning in coding（python）：pandas数据包DataFrame数据结构简介

导入模块：import pandas as pdimport numpy as np #pandas依赖于numpyfrom sklearn import preprocessingimport xgboost as xgb常用功能简介：#load train and test train = pd.read_csv('train.csv', index_co
复制链接

扫一扫