本人作为一名IT工程师同时对数据分析这一块挺感兴趣的,平时也有用到python,偶然间看到七月在线python数据分析的课程好评很多,然后价格比较实惠就打算来学习了,下面是我的一部分学习笔记和大家分享
一、python安装介绍(因为比较简单简单介绍下)
for Mac:
法一:官网下载:https://www.python.org,下载mac版本,之后直接双击即可快速安装
法二:直接利用homebrew,通过命令 brew installpython3安装即可
另外,为了方便编程以及利用有用的库,建议安装anaconda。
for Linux:
官网下载linux版本后再linux平台上自行安装
for Windows:
同理,建议安装anaconda。
建议直接下载python3.6以上的版本,因为python2.0版本已经不更新了
二、python基础概念
列表
List(列表):是Python中使用最频繁的数据类型。列表可以完成大多数集合类的数据结构实现。它支持字符,数字,字符串甚至可以包含列表(嵌套)
列表用[ ]标识,是Python最通用的复合数据类型。
列表中的值分割可以用到变量[头下标;尾下标],就可以截取相应的列表,从左到右索引默认0开始,从右到左默认-1开始,下标可以为空表示取到头或尾。
加号(+)是列表链接运算符,星号(*)是重复操作。
元组
元组是另一种数据类型,类似于List。
元组用()标识。元素值不能更新,相当于只读列表
字典
字典(dictionary)是除列表以外Python之中最灵验的内置数据结构类型。列表是有序的对象结构,字典是无序的对象集合。
两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取
字典用{ }标识。字典由索引(key)和它对应的值(value)组成。
索引及分片
索引:列表或者元组中的所有元素都是有编号的----从0开始递增。这些元素可以通过编号分别访问
可以通过索引获取元素。所有列表或者元组可以通过这种方式进行索引。使用负数索引时,就是从列表最后一个元素开始计数,倒数第一为-1,倒数第二个为-2,依次按照负数大小从右往左绝对值大小递增编号。
分片:与使用索引来访问单个元素类似,可以使用分片操作来访问移动范围内的元素。分片通过冒号隔开的两个索引来实现
分片操作的实现需要提供两个索引作为边界,第1个索引的元素是包含在分片内的,而第2个则不包含在分片内。
分片操作的实现需要提供两个索引作为边界,第1个索引的元素是包含在分片内的,而第2个则不包含在分片内。
数字Python支持五种基本数字类型,其中有三种是整数类型。
int (有符号整数)long(长整数)
bool (布尔值)
float (浮点值)
complex (复数)
Numpy简介
Numpy是Python下的一个library。
numpy最主要的是支持矩阵操作与运算
非常高效是numpy的优势,core为C编写。提升了python的处理效率
numpy是一些与比较流行的机器学习框架的基础。名词解释:ndarray是numpy的核心数据类型,即(n-dimensional array)多维数组tensorflow中的tensor(张量),它本质上也多维数组,但这个名字很高大上。因此,理解多维数组对之后的机器学习会有很大帮助。导入import numpy as np
pandaspandas基本功能
开发pandas时提出的需求
具备按轴自动或显式数据对齐功能的数据结构
集成时间序列功能
既能处理时间序列数据也能处理非时间序列数据的数据结构
数学运算和约简(比如对某个轴求和)可以根据不同的元数据(轴编号)执行
灵活处理缺失数据
合并及其他出现在常见数据库(例如基于SQL的)中的关系型运算数据结构
学习心得:python和java,c++等编程语言来说比较入门,但是要学好的话也是要花很多时间的,然后觉得正好在学习python数据分析的同时,熟悉一下python其他的库对自己现在的工作也有很大的帮助。最后给七月在线的python数据分析课程点个赞