利用Python进行数据分析

本文详细介绍了Python数据分析的基础,包括Python语言、内建数据结构、Numpy、pandas、数据清洗和可视化。重点讲解了Numpy的数组和向量化计算,pandas的数据结构及其操作,以及数据清洗和预处理的技巧。最后探讨了绘图和数据可视化的基本方法,如matplotlib和seaborn库的使用。
摘要由CSDN通过智能技术生成

一.预备知识

一些重要的Python库:

Numpy

pandas

matplotlib

Scipy

scikit-learn

statsmodels

二.Python语言基础

缩进   import   运算符(is    is not)  

数据类型:数值型    字符串   Bytes  Unicode     时间类型     布尔型      空值(None)

控制流程:if   elif   else     for循环(for...in...)    while循环   pass    range函数    三元表达式

三.内建数据结构,函数和文件

1.数据结构与序列

1.tuple:元组  长度固定,不可改变的序列     用( )或只用逗号表示

2.list:列表    大小和内容都可以变    用[ ]表示

append   insert   remove     extend     sort(直接更改原有的序列)   切片

bisect.bisect        bisect.insort

3.内建的序列函数:enumerate      sorted(返回一个新的序列)     zip    reversed

4.dict:字典    key : value形式       用{ }表示

in    del   pop   update(合并两个dict) get       setdafault       hash

d1.keys      d1.values             

5.set:集合      无序且元素是不重复的,就像是key唯一且没有value的字典      用{ }表示

并集:union、|       交集:intersection、&       差集:difference、-      对称差集(x-y与y-x的并集):symmetric_difference、^

子集:issubset        超集:issuperset

6.list,set和dict推导式

map     嵌套列表表达式

2.函数

1. 命名空间,作用范围,局部函数

2.返回多个值(返回一个tuple)

3.函数是对象

4.匿名函数,lambda函数

5.柯里化(Currying):局部参数应用

6.生成器 Generators

7.错误和异常处理

3.文件以及操作系统

 open   close     read      write      seek      

with  open(path)   as  f :  ...      这种打开方式可以自动关闭文件

四.Numpy基础:数组和向量化计算

1.多维数组对象

np.random.randn       

np.array   np.zeros  np.empty    np.arange     np.arange().reshape()     

arr.dtype    arr.shape   arr.ndim     arr.size

arr.astype(转换类型)     np.string_  

数组间的计算:点对点计算(element-wise)    +      -      *     /     **    >

索引和切片

布尔索引        花式索引

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值