利用Python进行数据分析
MrUncle德鲁
发现自己并喜欢自己
展开
-
python数据分析资料
Python进阶Python CookbookNumpyNumpy菜鸟数据分析利用 Python 进行数据分析可视化(常用的绘图熟悉一下) Matplotlib 3.4.2 documentationMatplotlib中文实例Scipy需要有一定的微积分、概率论基础,可以后面再看SciPy 教程...原创 2021-08-11 22:00:23 · 171 阅读 · 0 评论 -
ch8_02 数据规整:聚合、合并、重塑
【Jupyter notebook】阅读模式接上一部分轴向连接另一种数据合并运算也被称作连接(concatenation)、绑定(binding)或堆叠(stacking)。NumPy的concatenation函数可以用NumPy数组来做:import numpy as npimport pandas as pdarr = np.arange(12).reshape((3,4...原创 2018-11-11 17:23:28 · 371 阅读 · 0 评论 -
ch9_02 绘图和数据可视化
使用pandas 和seaborn绘图import pandas as pdimport numpy as npimport matplotlib.pyplot as plt线型图Series和DataFrame都有一个用于生成各类图表的plot方法。默认情况下,它们所生成的是线型图s = pd.Series(np.random.randn(10).cumsum(),index=...原创 2018-12-04 15:22:40 · 633 阅读 · 0 评论 -
ch9_01 Matplotlib 绘图和数据可视化
【Jupyter notebook 模式】9.1、matplotlibAPI 入门import matplotlib.pyplot as pltimport numpy as npdata = np.arange(10)dataarray([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])plt.plot(data)[<matplotlib.lines.Li...原创 2018-12-02 22:22:29 · 1117 阅读 · 0 评论 -
ch11_02 时间序列
import pandas as pdimport numpy as npfrom datetime import datetimeWOM日期WOM(Week of Month)是一种非常实用的频率类# 每个月的第三个星期五rng = pd.date_range('2012-01-01','2012-09-01',freq='WOM-3FRI')list(rng)[Time...原创 2018-12-27 14:29:03 · 241 阅读 · 0 评论 -
数据可视化Matplotlib(想要的图,都有了!)
【资料来源】# -----------------------------------------------------------------------------# Copyright (c) 2015, Nicolas P. Rougier. All Rights Reserved.# Distributed under the (new) BSD License. See LIC...原创 2018-12-11 15:47:01 · 1643 阅读 · 0 评论 -
ch11 时间序列
11.1日期和时间数据类型及工具Python标准库包含用于日期(date)和时间(time)数据的数据类型,而且还有日历方面的功能。我们主要会用到datetime、time以及calendar模块from datetime import datetimenow = datetime.now()nowdatetime.datetime(2018, 12, 25, 9, 25, 16,...原创 2018-12-25 16:10:06 · 356 阅读 · 0 评论 -
ch12_01 pandas 高级应用
【Jupyter notebook 模式】1、分类数据import numpy as npimport pandas as pdvalues = pd.Series(['apple','orange','apple','apple']*2)values0 apple1 orange2 apple3 apple4 apple5 o...原创 2019-01-05 10:23:49 · 159 阅读 · 0 评论 -
Numpy_100题(1)
Numpy 100 题(01)翻译自【100 Numpy exercises】1、导入numpy 模块import numpy as np2、显示numpy版本信息和配置信息print(np.__version__)print(np.show_config)1.15.4<function show at 0x0000020E6D935048>3...翻译 2019-03-03 20:53:48 · 924 阅读 · 0 评论 -
ch8_01 数据规整:聚合、合并、重塑
Jupyter notebook阅读模式在许多应用中,数据可能分散在许多文件或数据库中,存储的形式也不利于分析。本章关注可以聚合、合并、重塑数据的方法。import pandas as pdimport numpy as np8.1 层次化索引层次化索引(hierarchical indexing)能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低维度形式处理高维度...原创 2018-11-11 17:21:39 · 255 阅读 · 0 评论 -
ch6_02 数据加载、存储&文件格式
jupyter notebook阅读模式更好!6.2 二进制文件格式实现数据的高效二进制格式存储最简单的办法之一是使用Python内置的pickle序列化。pandas对象都有一个用于将数据以pickle格式保存到磁盘上的to_pickle方法:import pandas as pdimport csvframe = pd.read_csv('data/examples/ex1.c...原创 2018-11-05 21:07:06 · 208 阅读 · 0 评论 -
4_1 Numpy基础:数组和矢量计算
利用python进行数据分析看这里第四章 简介NumPy之于数值计算特别重要的原因之一,是因为它可以高效处理大数组的数据。这是因为:NumPy是在一个连续的内存块中存储数据,独立于其他Python内置对象。NumPy的C语言编写的算法库可以操作内存,而不必进行类型检查或其它前期工作。比起Python的内置序列,NumPy数组使用的内存更少。NumPy可以在整个数组上执行复杂...原创 2018-09-10 08:56:13 · 251 阅读 · 0 评论 -
4_2 Numpy基础:数组和矢量计算
利用Python进行数据分析这里有矿数组的转置和轴对换import numpy as np转置可以使用transpose()方法,也可以使用T属性arr = np.arange(15).reshape((3,5))arrarray([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10,...原创 2018-09-10 09:02:57 · 333 阅读 · 0 评论 -
4_3 Numpy基础:数组和矢量计算
利用Python进行数据分析确定不点我查看效果不知道好多少倍,嗯~4.4 用于数组的文件输入输出np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的:import numpy as nparr = np.arange(10)np.save('data/arr4_4',arr)...原创 2018-09-10 09:12:55 · 243 阅读 · 0 评论 -
5_2 Pandas入门
Jupyter Notebok查看效果更佳!丢弃指定轴上的项import pandas as pdimport numpy as npobj = pd.Series(np.arange(5.),index = ['a', 'b','c', 'd', 'e'])obja 0.0b 1.0c 2.0d 3.0e 4.0dtype: float64...原创 2018-10-29 21:04:17 · 223 阅读 · 0 评论 -
5_1 Pandas入门
这里可以查看Jupyter Notebook模式,效果更加!pandas是基于Numpy数组构建的,二者最大的不同是Pandas是专门为处理表格和混杂数据设计的,而Numpy更适合处理统一的数值数组数据首先导入包import pandas as pdfrom pandas import Series, DataFrame5.1pandas的数据结构介绍pandas的两个主要数据...原创 2018-10-26 22:30:47 · 202 阅读 · 0 评论 -
5_3 Pandas入门
Jupyter notebook阅读效果更佳函数应用和映射numpy 的ufunc(元素级数组方法)也可用于pandas对象import pandas as pdimport numpy as npframe = pd.DataFrame(np.random.randn(4,3), columns=list('bde'), index=['...原创 2018-10-31 22:06:44 · 264 阅读 · 0 评论 -
ch7_01 Pandas 数据清洗和准备
Jupyter nobook模式,不一样的阅读体验import pandas as pdimport numpy as np7.1处理缺失值对于数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据。我们称其为哨兵值,可以方便的检测出来:string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'av...原创 2018-11-06 20:04:12 · 299 阅读 · 0 评论 -
ch7_02 Pandas 数据清洗和准备
Jupyter notebook阅读模式离散化和面元划分为了便于分析,连续数据常常被离散化或拆分为“面元”(bin)。假设有一组人员数据,而你希望将它们划分为不同的年龄组:接下来将这些数据划分为“18到25”、“26到35”、“36到60”以及“60以上”几个面元。要实现该功能,你需要使用pandas的cut函数:import pandas as pdages = [20,22,25...原创 2018-11-06 20:05:47 · 432 阅读 · 0 评论 -
ch6_01 Pandas 数据加载、存储&文件格式
Jupyter notebook给你不一样的阅读体验!输入输出通常分为以下几大类:读取文本文件和其他的更高效的磁盘存储格式、加载数据库中的数据、利用Web API操作网络资源6.1读写文本格式的数据pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。下表进行了总结,其中用的比较多的就是read_csv和read_tableimport pandas as p...原创 2018-11-04 20:55:37 · 581 阅读 · 0 评论 -
3_1 Python的数据结构、函数和文件
这里查看效果更好哪里3.1数据结构和序列python数据结构简单强大,主要有元组、列表、字典、集合元祖长度固定、不可变。有两种方式创建:1、使用圆括号将元素括起来;2、直接使用逗号将元素分隔tul1 = 1,2,3tul2 = (4,5,6)tul1(1, 2, 3)type(tul1)tuple使用tuple()函数可以将...原创 2018-09-12 08:39:28 · 224 阅读 · 0 评论