Python-数据分析
Luuuuuuuuuuke
这个作者很懒,什么都没留下…
展开
-
《利用python进行数据分析》Chapter 8
本章主要内容为对存在于不同文件的数据或者以不易于进行分析的格式存储的数据进行数据联合、连接以及重新排列。原创 2020-02-28 11:51:35 · 287 阅读 · 0 评论 -
《利用Python进行数据分析》Chapter 7
在数据分析和建模的过程中,大量的时间花在数据准备上:加载、清理、转换和重新排列。这样的工作占了分析师80%以上的时间。本章内容主要讲解pandas中用于缺失值、重复值、字符串操作和其他分析数据转换的工具。1. 处理缺失值pandas对象的所有描述性统计信息默认情况下是排除缺失值的。对于数值型数据,pandas使用浮点值NaN来表示缺失值,所以NaN是容易检测到的标识值。1.1 过滤缺失值...原创 2020-02-27 11:20:43 · 602 阅读 · 0 评论 -
《利用Python进行数据分析》Chapter 6
本章主要介绍pandas对数据分输入和输出。通常有以下几种类型:读取文本文件及硬盘上其他更高效的格式文件、从数据库载入数据、与网络资源进行交互(比如Web API)。1. 文本格式数据的读写使用最多的函数:read_csv : 从文件、URL或文件型对象读取分隔好的数据,默认分隔符是逗号read_table: 从文件、URL或文件型对象读取分隔好的数据,默认分隔符是制表符(’\t’)re...原创 2020-02-24 10:07:07 · 323 阅读 · 0 评论 -
《利用Python进行数据分析》Chapter 5
本章主要介绍pandas数据结构和基本操作。Numpy适合处理同质型的数值类数组数据,而 pandas是用来处理表格型或异质型数据的,经常和其他数值计算工具,比如NumPy和Scipy,以及可视化工具matplotlib一起使用的。1.数据结构1.1 Series1.1.1 一种一维的数组型对象,包含了一个值序列,并且包含了数据标签,即索引。obj = pd.Series([4, 5, ...原创 2020-02-22 14:09:28 · 342 阅读 · 0 评论 -
《利用python进行数据分析》Chapter 4
本章着重介绍NumPy基础知识。由于NumPy提供了一个非常易用的C语言API,可以将数据传递给用底层语言编写的外部类库,再由外部类库将计算结果按照NumPy数组的方式返回。这个特征使得Python可以对存量C/C++/Fortran代码库进行封装,并为这些代码提供动态、易用的接口。NumPy对含有大量数组的数据非常有效。NumPy在内部将数据存储在连续的内存块上,这与其他的Python...原创 2020-02-17 17:40:11 · 348 阅读 · 0 评论 -
《利用python进行数据分析》Chapter 3
本章主要介绍python的常用数据结构以及函数的用法。1. 数据结构和序列1.1 元组1. 一种固定长度、有序且不可变的python对象序列。tup = (4,5,6)2. 支持+号连接以及*号直接复制多个。1.2 列表1. 有序、可变。2. append 尾部增加元素,insert 指定位置插入元素,后者比前者计算代价更高。3. pop 将特定位置的元素移除并返回该元素。...原创 2020-02-16 00:24:07 · 202 阅读 · 0 评论 -
《利用Python进行数据分析》Chapter 2
本章内容主要介绍了ipython的常用命令以及python语言基础知识。1. Ipython基础特点相比于python自带的ide,ipython可读性更好一点,支持tab键补全(命名空间以及输入历史等),以及执行任意代码块(通过复制粘贴)和整个python脚本的功能。内省变量名的前后使用?可以显示一些关于该对象的概要信息。对函数使用?来显示文档字符串,使用??来显示函数的源代码。?...原创 2020-02-15 16:20:31 · 483 阅读 · 0 评论 -
《利用Python进行数据分析》Chapter 1
本章内容为全书学习的准备工作,主要介绍了一下部分内容。1. 数据的类型表格型数据多维数组(矩阵)相关联的多张表(主键和外键)时间序列2. Python进行数据分析的优缺点解释型语言、胶水语言效率低全局解释器锁(GIL)3. 重要的Python库(数据科学相关)Numpy描述待补充。下同。PandasmatplotlibIpython和jupyterScipysci...原创 2020-02-14 17:08:38 · 134 阅读 · 0 评论