python第一讲——数据预处理1

1.Numpy基础 

1.1概述

  • Numpy的基本用法
    import numpy as np
    
    arr = np.ones(5)
    print(arr)
    type(arr)
    
    >>>[1. 1. 1. 1. 1.]//输出是有点点的
    numpy.ndarray

1.2 Numpy中的数组 

1.2.1创建数组:

           1.从python列表转换:将python列表传递数组函数以创建Numpy数组。

arr = np.array([1,2,3,4,5])
arr
>>>array([1,2,3,4,5])  #每个数字的结尾都有逗号


arr = np.array(range(0,6))
arr
>>>array([0,1,2,3,4,5])

            2.使用Numpy内部功能函数:

arrange() : 用于快速创建一维数组

zero() : 函数创建一个填充0的数组             ones() : 创建一个填充1的数组

                                       

  full()函数创建一个填充给定值的数组   

 

2*(3*3):构建两个三行三列的矩阵,矩阵里面填充6

empty() :创建一个数组,它的初始内容是随机的,取决于内存的状态 

eye() :创建对角线为1的数组 

random() :创建一个填充01之间随机值的数组。

np.random.random((2,3))
#和rand,randn参数类型不同,这两个采用可变参数,而random采用元组

>>>array([[0.07558929,0.65113013,0.00673818],
          [0.73596032,0.68664976,0.38539903]])

1.2.2创建向量(向量只有一列)

 

 1.3 数组的操作

1.3.1数据类型

  • 通过ndarraydtype属性可以获取数组的数据类型;此外,在创建数组时,可以使用dtype参数来指定数组的数据类型,astype()方法也可以进行类型转换。

 

 

 1.3.2 数组形状

通过数组对象的shape属性获取到形状。

 resize():方法会修改数组本身

 1.3.3 数组索引(?)

 

 整数索引、整数数组(列表)索引、切片、布尔数组索引、where()函数

1.3.4 赋值、视图与拷贝(?)

赋值:不会复制数组对象或其数据

视图(浅拷贝):视图是一个新对象,但它与原数组共享数据。

拷贝(深拷贝):

2.Pandas基础

2.1概述

2.2Pandas的数据结构

2.2.1Series

是带标签的一维数组,标签又称索引。

1.创建Series对象:

data支持字典、一维数组、标量值

  •  使用字典创建:

NaN表示缺失数据

  • 使用一维数组创建
  • 使用标量创建

 

 2.series的使用

  • 索引:支持下标索引和标签索引,也支持切片。(使用下标切片时,不包括最后一个元素,使用标签切片时,包括最后一个元素)
  • 自动对齐:按标签对齐。

 

 2.2.2DataFrame

本质上是二维表。

1.创建DataFrame

  • 使用二维数组创建

  • 使用series字典创建
  • 使用列表字典和字典列表创建

 2.查看数据

head():从头开始看

tail():从尾开始看

shape():查看DataFrame的形状

3.数据索引

  • [ ]:索引运算符
  • loc[ ]:基于标签进行索引,也可以与布尔数组一起使用

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值