自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 数据分析打卡05

搭建模型 以泰坦尼克号为例 #导入所需的库 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from IPython.display import Image plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签 plt.rcParams['axes.unicode_minus'] = False # 用来正常

2020-08-28 09:20:37 381

原创 数据分析打卡04

数据可视化 以泰坦尼克号为例 # 加载所需的库 import numpy as np import pandas as pd import matplotlib.pyplot as plt # 导入result.csv这个文件 text = pd.read_csv(r'result.csv') text.head() import matplotlib.pyplot as plt #可视化展示泰坦尼克号数据集中男女中生存人数分布 情况 sex = text.groupby('Sex')['Survive

2020-08-25 22:01:17 203

原创 数据分析打卡03

数据重构 1、数据的合并 (1)concat方法:将数据横向合并在一起 text_left_up = pd.read_csv("data/train-left-up.csv") text_right_up = pd.read_csv("data/train-right-up.csv") text_left_up.head() text_right_up.head() list_up = [text_left_up,text_right_up] result_up = pd.concat(list_up

2020-08-23 13:57:46 173

原创 数据分析打卡02

数据清洗与特征处理 原数据通常是脏数据,在对数据进行后续处理之前,需要先对数据进行清洗以及特征处理。数据清洗一般来说包括对数据进行缺失值处理、异常值检测以及数据转换等。 1、缺失值观察和处理 (1)查看缺失值方式 缺失值在数据中一般为空白或NaN形式 查看所在列缺失值数量,以泰坦尼克号为例 #加载所需的库 import numpy as np import pandas as pd #加载数据train.csv df = pd.read_csv('train.csv') df.head(3) #方法一 df

2020-08-20 20:39:20 160

原创 数据分析打卡01

数据载入及初步观察 以泰坦尼克号数据集为例 1、导入数据集 对于csv文件可以采用pd.read_csv()的方式,加载的时候需要加上文件的路径 #加载所需的库 import numpy as np import pandas as pd #载入之前保存的train_chinese.csv数据,关于泰坦尼克号的任务,我们就使用这个数据 text = pd.read_csv('train_chinese.csv') text.head() #查看数据形式,一般默认为前5个 数据集共有12列,目标变量Su

2020-08-19 21:53:04 291

原创 python打卡10

文件与文件系统 1、打开文件 open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True) file: 必需,文件路径(相对或者绝对路径)。 mode: 可选,文件打开模式 buffering: 设置缓冲 encoding: 一般使用utf8 errors: 报错级别 newline: 区分换行符 【例】打开一个文件,并返回文件对象,如果该文件无法被打开,会抛出OSError f

2020-08-08 23:52:02 88

原创 python打卡09

模块 1、模块 模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。 容器 -> 数据的封装 函数 -> 语句的封装 类 -> 方法和属性的封装 模块 -> 程序文件 2、命名空间 (1)内置命名空间(Built-in Namespaces):内置函数的命名空间都属于内置命名空间,在任何程序中可以直接运行它们,不需要做什么操作,可以拿过来直接使用; (2)全局命名空间(Module:Global Namespaces):不

2020-08-07 22:48:32 142

原创 python打卡08

类与对象 1、对象 = 属性 + 方法 对象是类的实例。类主要定义对象的结构,然后以类为模板创建对象。类不仅包含方法定义,而且还包含所有实例共享的数据。 封装:信息隐蔽技术 使用关键字class定义python类,关键字后面紧跟类的名称、分号和类的实现。 python中类名以大写字母开头 继承:子类自动共享父类之间数据和方法的机制 class MyList(list): pass lst = MyList([1, 5, 2, 7, 8]) lst.append(9) lst.sort() prin

2020-08-04 20:46:28 216

原创 python打卡07

函数与Lambda表达式 1、函数 定义: 函数以def关键词开头,后接函数名和圆括号()。 函数执行的代码以冒号起始,并且缩进。 return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。 调用函数:给定义的函数的自变量一个赋值来执行函数 函数参数形式: 位置参数 (positional argument) 默认参数 (default argument) 可变参数 (variable argument) 关键字参数 (keyword argument) 命

2020-08-02 23:44:30 70

原创 python打卡06

字典 可变类型与不可变类型 1、字典以“关键字”进行索引,关键字可以是任意不可变类型 2、字典是python唯一的一个映射类型,字符串、元组、列表属于序列类型。 判断数据类型x是不是可变类型: (1)id(x),若操作前后id不一样,则x不可变,若一样,x可变; (2)hash(x),只要不报错,则x可被哈希,即不可变。 数据、字符和元组均可被哈希—>不可变类型 列表、集合、字典不能被哈希---->可变类型 字典的定义 字典是无序的键值对(key:value)集合,在同一个字典中,键互不相同。

2020-07-31 23:34:45 175

原创 python05

列表 1、列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语法为 [元素1, 元素2, …, 元素n] 2、创建列表 (1)[] (2)range() (3)二维列表–>dataframe 列表内容可以更改 3、向列表中添加元素 list.append(obj),把一个东西整体添加在列表后 list.extend(seq),在列表末尾一次性追加另一个序列中的多个值 list.insert(index, obj) 在编号 index 位置插入 obj 4、删除列表中的元素

2020-07-28 21:28:17 128

原创 python打卡04

异常处理 1、python异常总结 BaseException:所有异常的 基类 Exception:常规异常的 基类 StandardError:所有的内建标准异常的基类 ArithmeticError:所有数值计算异常的基类 FloatingPointError:浮点计算异常 OverflowError:数值运算超出最大限制 ZeroDivisionError:除数为零 AssertionError:断言语句(assert)失败 AttributeError:尝试访问未知的对象属性 EOFError:没

2020-07-25 22:48:56 79

原创 python打卡03

条件语句 1、if 语句 if 表达式: 语句表达式(表达式真,执行) 注:单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。 2、if-else if 表达式: 语句表达式(表达式真,执行) else: 语句表达式(表达式假,执行) 注:if语句支持嵌套,即在一个if语句中嵌入另一个if语句,从而构成不同层次的选择结构。 3、if-elif-else if expression1: expr1_true_suite elif expressi

2020-07-23 23:39:55 89

原创 python打卡02

位运算 1、原码、反码和补码 二进制有三种不同的表示形式,分别是:原码、反码和补码(计算机内部使用)。 原码:二进制数; 反码:正数的反码是原码,负数的反码是符号位不变,其余位取反; a:正数与原码相同,如:10 反码0000 1010 b: 负数为原码0变1,1变0,(符号位不变)如:-10 反码1111 0101 补码:正数的补码就是原码,负数的补码是反码+1; a:正数的补码与原码相同,如:10 补码0000 1010 b:负数的补码为反码加1,如:-10 反码:1111 010

2020-07-22 18:56:56 133

原创 python打卡01

** 运算符: ** 算术运算符 逻辑运算符 例子: print((3 > 2) and (3 < 5)) # True print((1 > 3) and (2 < 1)) # False print((1 > 3) or (3 < 5)) # True 注:and连接时,必须全部都为真---->真 位运算符 按位取反: 针对二进制数的操作,指将两个二进制数的每一二进位都进行取反操作, 0 换成 1 , 1 换成0; 按位与:针对二进制数的操作,指将两个

2020-07-21 16:35:44 130

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除