自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 DataWhale之task02-数据清洗及特征处理

数据导入import numpy as npimport pandas as pd#加载数据 train.csvdf_train = pd.read_csv('train.csv')数据清洗及特征处理缺失值观察#查看每个特征的缺失值df_train.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 891 entries, 0 to 890Data columns (total 12 columns): #

2021-07-15 10:37:00 128

原创 DataWhale之task01-探索性数据分析(EDA)

import numpy as npimport pandas as pddf = pd.read_csv("train_chinese.csv")df.head() 乘客ID 是否幸存 乘客等级(1/2/3等舱位) 乘客姓名 性别 年龄 堂兄弟/妹个数 父母与小孩个数 船票信息 票价 客舱 登船港口

2021-07-13 14:08:34 154

原创 DataWhale之task01-pandas基础

import numpy as npimport pandas as pdsdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}example_1 = pd.Series(sdata)example_1Ohio 35000Texas 71000Oregon 16000Utah 5000dtype: int64data = {'state': ['Ohio', '

2021-07-12 16:04:27 121

原创 DadaWhale之task01-数据初步探索

import numpy as npimport pandas as pd#相对路径train = pd.read_csv("train.csv") # ../上级文件夹test = pd.read_csv("test.csv") #绝对路径train = pd.read_csv(r‘C:\Users\63509\Desktop\titanic’)#查看当前工作目录import osos.getcwd()'C:\\Users\\63509\\DataWhale'read_c

2021-07-12 16:00:20 75

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除