《利用python进行数据分析》笔记

6.24

导入模块:

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

第三章,内建数据结构,函数及文件

python的常用数据结构:元组(tuple),列表(list),字典(dict)和集合(set).

1. 元组:长度和内容不可变。

创建元组:tup = 4,5,6 or tuple()

tup.count()  用于计量某个数值在元组中出现的次数。

2. 列表:长度和内容均可变。

创建列表:a = [1,2,3] or a = list()

list函数在数据处理中常用于将迭代器或者生成器转化为列表。

gen = range(10)

增加和移除元素:append将元素添加到列表的尾部;insert将元素插入到指定的列表位置;pop会将特定位置的元素移除并返回,是insert的反操作;remove会定位第一个符合要求的值并移除它。

使用in关键字检查一个值是否在列表中: [in]: 'dwarf' in b  [out]: True

连接和联合列表:两个列表用‘ + ’号连接。如果有一个已经定义的列表,可以用extend方法向该列表添加多个元素:x.extend()

排序:sort: a.sort()

二分搜索:bisect:bisect.bisect会找到元素应当被插入的位置,bisect.insort将元素插入到相应位置:import bisect

bisect.bisect(a, 2); bisect.insort(a, 2)

切片:a[ : : -1]是将列表翻转。

enumerate: 枚举

for i, v in enumerate(collection):

  返回(i,value)元组的序列,其中value是元素的值,i是元素的索引。

sorted:sorted(a)

zip:将列表,元组或者其他序列的元素配对,新建一个元组构成的列表。

seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']
zipped = zip(seq1,seq2)
print(list(zipped))

【out】: [('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

reversed: 将元素倒序排列: reversed()

3. 字典(哈希表)

创建字典: dic = {} or dic = dict()

删除值:del 或者pop,pop方法会在删除的同时返回被删除的值,并删除键。

del a[5]

a.pop('dummy')

用update方法将两个字典合并:a.update(b)

4. 集合(set): 无序且元素唯一。

创建集合:set() 或者 {}

两个集合的并集:a.union(b) 或者 a | b

两个集合的交集:a.intersection(b) 或者 a & b

匿名函数(Lambda)

_____________________________________________________________________________________________________

6.25

第四章 NumPy基础:数组与向量化计算

numpy的核心特征之一就是N维数组对象——ndarray

import numpy as np
data = np.random.randn(2,3) #生成2x3的随机数组
数学操作:data * 10     data + data
属性:shape属性和dtype属性,分别用来表述数组每一维度的数量和数组的数据类型
data.shape  data.dtype

生成ndarray:用array函数: 

np.array()

zeros创造全0数组,ones创造全1数组,empty创建一个没有初始化数值的数组。

np.zeros(10)
np.empty((2,3,2)) #生成一个未初始化的2x3x2的数组,不一定是全零数组

arange是python内建函数range的数组版:

np.arange(15)

Numpy数组算数:允许进行批量操作而无需任何for循环

第5章:pandas入门

pandas是用来处理表格型或异质型数据的,而Numpy更适合处理同质型的数值类数组数据。

pandas数据结构:Series 和DataFrame

Series是一维的数组型对象,包含了值和索引。(values and index)

obj = pd.Series([4,7,-5,3])

obj.values
obj.index

_____________________________________________________________________________________________________还需要看看书

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值