自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 2020-08-28

第三章 模型搭建和评估–建模 导入库 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from IPython.display import Image 在IPython笔记本中显示文件中的图像 plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 用来正常显示中文标签 plt.rcParams[‘axes.unicode_mi

2020-08-28 22:31:43 172

原创 数据可视化

数据可视化 导入所需要的库 使用import命令导入numpy、pandas以及matplotlib三个库,用来做数据分析以及数据可视化。 使用pandas库的read_csv(‘文件名称’)读入csv文件,并使用 .head()函数在编译器中显示部分数据。 若想具体了解matplotlib库的使用规则以及函数名称,可以参照管网对应的使用手册 可视化展示泰坦尼克号数据集中男女中生存人数分布情况 sex = text.groupby(‘Sex’)[‘Survived’].sum() 此函数使用.groupb

2020-08-26 11:35:55 206

原创 数据重构

数据重构 看到这节学习内容时,我想到了自己硕士期间在使用matlab处理计算数据的内容。通过这次学习,可以加深本人对python的理解。 马上就开学了,今天依然是急急忙忙水作业的一天,不过等把手头上的事情忙完,还是要认真重新学习一下这一块的内容人生苦短,我用python 数据的合并 导入基本库 import numpy as np、import pandas as pd,并使用pd.read_csv函数将所要处理的数据导入。 使用pd.concat函数将两组数据合并为一张表,contact函数的参数axi

2020-08-23 21:48:49 342

原创 第二章:第一节数据清洗及特征处理

数据清洗简述 我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的样子。 缺失值观察 df.info() df.isnull().sum() df[[‘Age’,‘Cabin’,‘Embarked’]].head(3) 对缺失值进行处理 df[df[‘Age’]==None]=0 df.head(3) df[df[‘A

2020-08-20 22:19:46 179

原创 第一次学习:数据加载及探索性数据分析

第一次学习记录 先来卖惨!!!第一次用python,第一次用CSDN,第一次使用Github(之前都是下载代码后读代码,不管理),第一次数据分析实践,同时也是第一次收获! 接触了搞数据分析的大神才发现什么水利水电工程,流体力学、地球物理流体动力学都是一堆小儿科,敲代码它不香吗????????为什么要对着一堆数学公式推来推去呢(真香,虽然还是感觉推公式更容易一点) 第一节数据载入及初步观察 导入numpy和pandas库(小声逼逼,我除了这两个库还知道matplotlib,毕竟周围有大神整天挂在嘴边:人生苦

2020-08-19 20:49:59 166

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除