自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 Data_Analysis_task5

第三章 模型搭建和评估经过前面的探索性数据分析我们可以很清楚的了解到数据集的情况import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltfrom IPython.display import Image%matplotlib inlineplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcP

2020-08-26 18:07:16 278

原创 第二章:第四节数据可视化-课程

**复习:**学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。2 第二章:数据可视化开始之前,导入numpy、pandas以及matplotlib包和数据# 加载所需的库# 如果出现 ModuleNotFoundError: No module named 'xxxx

2020-08-24 15:38:04 458

原创 Data_Analysis_task3

复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。开始之前,导入numpy、pandas包和数据# 导入基本库import pandas as pdimport numpy as np# 载入data文件中的:train-left-up.csvdf=pd.read_csv(

2020-08-22 21:03:45 234

原创 Data_Analysis_数据清洗及特征处理

数据清洗首先导入numpy、pandas包和数据集#加载所需的库import pandas as pdimport numpy as np#加载数据train.csvdf=pd.read_csv('F:\Datewheel资料\hands-on-data-analysis-master\hands-on-data-analysis-master\第一单元项目集合/train.csv')df.head() PassengerId S

2020-08-21 14:26:49 537

原创 Data_Analysis_数据载入及探索性分析

数据载入在进行数据分析之前,我们首先需要将数据集导入到python中。1、先导入需要的包import pandas as pdimport numpy as np2、导入数据:数据的格式有多种,如:csv格式,xlsx格式,tsv格式等,都可用pandas中的方法导入。df=pd.read_csv('F:\Datewheel资料\hands-on-data-analysis-master\hands-on-data-analysis-master\第一单元项目集合/train.csv')df

2020-08-18 21:18:54 860

原创 python-函数与lambda表达式

2020-08-02 22:41:40 98

原创 python-字典

2020-07-31 23:22:18 115

原创 python-列表、元组、字符串

列表练习lst = [2, 5, 6, 7, 8, 9, 2, 9, 9]lst.append(15)print(lst)#[2, 5, 6, 7, 8, 9, 2, 9, 9, 15]lst=[2, 5, 6, 7, 8, 9, 2, 9, 9]lst.insert(len(lst)//2,20)print(lst)#[2, 5, 6, 7, 8, 20, 9, 2, 9, 9, 15]lst=[2, 5, 6, 7, 8, 9, 2, 9, 9]lst.extend([

2020-07-27 15:39:19 237

原创 python-异常处理

异常处理Python 标准异常总结BaseException:所有异常的 基类Exception:常规异常的 基类StandardError:所有的内建标准异常的基类ArithmeticError:所有数值计算异常的基类FloatingPointError:浮点计算异常OverflowError:数值运算超出最大限制ZeroDivisionError:除数为零AssertionError:断言语句(assert)失败AttributeError:尝试访问未知的对象属性EOFError:

2020-07-24 21:02:29 98

原创 python-条件循环结构

条件结构if 语句if expression: expr_true_suiteif 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。if - else 语句if expression: expr_true_suiteelse: expr_false_suite

2020-07-23 23:12:07 99

原创 python-TASK01

python-变量、运算符与数据类型练习题:3、python 中 is, is not 与 ==,!=的区别是什么?①is, is not 对比的是两个变量的内存地址;==, != 对比的是两个变量的值②当比较的两个变量,指向的都是地址不可变的类型(str等),那么is,is not 和 ==,!= 是完全等价的。③对比的两个变量,指向的是地址可变的类型(list,dict,tuple等),则两者是有区别的。...

2020-07-21 20:57:45 129

原创 pandas下-综合练习

综合练习端午节的淘宝粽子交易端午节的淘宝粽子交易(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。df=pd.read_csv('F:\Datewheel资料\pandas组队学习\Pandas(下)综合练习数据集\端午粽子数据.csv')df.head()df.info()#查看列名df.columns()注意列名中含有空格,后面处理的时候要特别注意。#删除最后一列为缺失值的行df_1=df.copy().dropna(axis=0,subset=['发

2020-07-01 21:19:03 239

原创 pandas-时序数据

时序数据时序的创建四类时间变量时间点的创建1、to_datetime方法pd.to_datetime('2020.1.1')pd.to_datetime('2020 1.1')pd.to_datetime('2020 1 1')pd.to_datetime('2020 1-1')pd.to_datetime('2020-1 1')pd.to_datetime('2020-1-1')pd.to_datetime('2020/1/1')pd.to_datetime('1.1.2020'

2020-06-28 20:17:28 181

原创 Pandas-分类数据

Pandas-分类数据category的创建及其性质分类变量的创建用Series创建对DateFrame指定类型创建利用内置Categorical类型创建利用cut函数创建分类变量的结构descibe方法categories和ordered属性类别的修改利用set_categories修改利用rename_categories修改利用add_categories添加利用remove_categories移除分类变量的排序序的建立排序分类变量的比较操作与标量或等长序列的比较与另一分类变量的比较categor

2020-06-27 16:32:09 473

原创 Pandas-文本数据

文本数据文本数据string类型的性质string与object的区别拆分与拼接str.split方法str.cat方法替换子串匹配与提取常用字符串方法过滤型方法isnumeric方法文本数据string类型的性质string与object的区别① 字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随着缺失值的存在而改变返回类型;② 某些Series⽅法不能在string上使⽤,如 Series.str.dec

2020-06-26 15:35:07 339

原创 Pandas-缺失数据

Pandas学习TASK1缺失数据缺失观测及其类型了解缺失信息三种缺失符号缺失数据的运算与分组加法与乘法运算规则groupby中的缺失值缺失数据的填充与剔除填充剔除插值线性插值高级插值练习练习一练习二缺失数据本章学习关于缺失数据的处理,具体包括缺失观测及其类型、缺失数据的运算与分组、填充与剔除、插值。缺失观测及其类型了解缺失信息可以使用isna和notna来了解缺失信息,对series使用会返回布尔列表,对DateFrame使用会返回布尔表。三种缺失符号1、np.nan,它不等于任何东西,在n

2020-06-23 18:40:20 707

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除