![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据分析和可视化
CFF_伊人
在校大学生,计算机专业,主要学习数据分析、挖掘。对爬虫、人工智能等领域也有着浓厚的兴趣。
展开
-
Python Numpy 使用函数进行简单的统计分析
1. 排序在NumPy中,直接排序经常使用sort函数,无返回值;间接排序经常使用argsort函数和lexsort函数。使用sort函数进行直接排序使用sort函数排序时,可以指定一个axis参数,使得sort函数可以沿着指定轴对数据集进行排序。axis=1 沿着横轴排序;axis=0 沿着纵轴排序使用argsort函数排序时,返回值为重新排序值得下标lexsor...原创 2019-05-03 22:31:11 · 1548 阅读 · 0 评论 -
美国股市分析——数据预处理、K-Means聚类算法
本篇文章主要学习对数据的预处理和K-Means聚类算法,代码很详细,下面直接附代码。缺失值与异常值处理import numpy as npimport pandas as pdDJIA_data=pd.read_csv('./data/DJIA_data.csv',encoding="gb18030") #导入美国股票数据print('原始数据形状为:',DJIA_data.sh...原创 2019-06-18 11:45:10 · 5791 阅读 · 1 评论 -
Python3 numpy,pandas,DataFrame基本操作
本文以学生成绩表为例,做几道简单的题。题目(1):求出每名同学的总成绩 按总成绩排序 重置排序后的索引 按性别进行分组分析 按总分进行分组统计,300分以下,300-400,400分以上代码:1.求出每名同学的总成绩import pandas as pdimport numpy as npstu_score=pd.read_excel ('./data/stu_s...原创 2019-06-21 17:38:04 · 3426 阅读 · 4 评论 -
Python 数据分析
数据分析基础学好数据分析首先需要了解统计学,统计分析是数据分析的基础,也是灵魂。下面列出统计分析的几个核心内容:描述统计,统计推断,概率论; 抽样,分布,估计,置信区间,假设检验; 线性回归,时间序列;数据分析工具SQL语言数据分析师最关键的一项技能就是会使用SQL语言操作数据库。关于SQL的学习推荐两个学习路径:w3school SQL必知必会Excel基本操作...原创 2019-06-10 16:11:33 · 318 阅读 · 0 评论 -
Python 科学计算和绘图实例附代码
初次学习,代码都有详解1.为点添加标签import numpy as npimport matplotlib.pyplot as pltN = 10data = np.random.random((N, 4))labels = ['point{0}'.format(i) for i in range(N)]plt.subplots_adjust(bottom = 0.1)...原创 2019-06-13 18:00:00 · 1749 阅读 · 0 评论 -
读取.npz文件并去掉数据中的空值
.npz文件的读取方法.npz内部是以数组的形式存储的,保存用的是savez ;读取用load。.npy单个数组以populations.npz的读取为例:import numpy as nppopulation_data=np.load("./data/populations.npz")print(population_data.files)#里面有两个数组 data ...原创 2019-05-29 17:11:37 · 1298 阅读 · 0 评论 -
Python 使用Pandas进行数据预处理
1.转换数据1.1哑变量处理类别型数据利用pandas库中的get_dummies函数对类别型特征进行哑变量处理。get_dummies语法:pandas.get_dummies(data,prefix=None,prefix_sep='_',dummy_na=False,columns=None,sparse=False,drop_first=False)data: 表示需...原创 2019-05-28 22:56:21 · 1451 阅读 · 0 评论 -
Python 和Pandas数据可视化分析 HR Data Descriptive & Prediction Analysis
下载数据集:网址链接:https://pan.baidu.com/s/178jLtzT1vpkHiIO6QBfPwQ提取码:xjku本篇文章是利用Python 和Pandas对人力资源数据集进行分析。共一万多条数据问题:工资,职业,月工时,满意度,是否离职(0-在职 1-离职),升职(0 没有升职,1升职),项目数之间有什么关系?首先要导入需要的库:mport nump...原创 2019-05-14 10:47:13 · 1078 阅读 · 0 评论 -
Python pandas,转换与处理时间序列数据
pandas库继承了NumPy库的datetime64以及timedelta64模块,能够快速实现时间字符串的转换、信息提取和时间运算。转换字符串为标准时间pandas时间相关的类 类名称 说明 Timestamp 最基础的时间类。表示某个时间点。绝大多数时间数据都是Timestamp形式 Timedelta 表示不同单位的时间,例如1d、1.5h、3min、4...原创 2019-05-10 16:24:27 · 9641 阅读 · 0 评论 -
掌握NumPy数组对象ndarray
1.1.1 创建数组对象NumPy 提供了两种基本对象:ndarray和ufunc。ndarray(下文统一称为数组)是存储单一数据类型的多维数组,而ufunc则是对数组进行处理的函数。1.数组的属性2.数组的创建NumPy提供的array函数可以创建一维或多维数组,基本语法格式如下:numpy.array(object,dtype=None,copy=True,ord...原创 2019-05-03 15:37:48 · 1640 阅读 · 0 评论 -
Matplotlib数据可视化基础 绘制各类简单图
饼图:import numpy as npimport matplotlib.pyplot as pltdef DrawPie(label,values,item): plt.figure(figsize=(6,6)) plt.title("{}figure".format(item)) plt.pie(values,explode=explode,labels...原创 2019-05-08 17:59:55 · 1027 阅读 · 0 评论 -
Python pandas,查改增删和描述分析DataFrame数据
查改增删DataFrame数据DataFrame作为一种二维数据表结构,能够和数据库一样实现查改增删操作,如添加一行,添加一列,删除一列,修改某一列的值等。创建一个数据表,并添加数据:修改行数据添加列数据修改列数据drop()函数删除某列或某行数据语法:DataFrame.drop(labels,axis=0,level=None,inplac...原创 2019-05-08 17:34:41 · 1218 阅读 · 0 评论 -
Python3 pandas,DataFrame的常用属性、访问DataFrame中的数据
查看DataFrame的常用属性DataFrame的基础属性有values、index、columns和dtypes,分别可以获取元素、索引、列名和类型。读取CSV数据查看DataFrame的属性访问DataFrame中的数据DataFrame单列数据获取DataFrame单列多行数据获取DataFrame多行多列数据获取DataFrame多行...原创 2019-05-08 17:14:03 · 4784 阅读 · 0 评论 -
掌握NumPy矩阵与通用函数(创建矩阵、ufunc函数、广播机制)
1.1.1 创建矩阵在Numpy中,矩阵是ndarray的子类。矩阵是继承自NumPy数组对象的二维数组对象。NumPy中矩阵是二维的。使用bmat函数创建矩阵矩阵运算1.1.2 掌握ufunc函数1.常用的ufunc函数运算常用的ufunc函数运算有四则运算、比较运算和逻辑运算等。数组的四则运算数组的比较运算在NumPy逻辑运算中,np...原创 2019-05-03 17:02:42 · 835 阅读 · 0 评论 -
二进制数据存储、读取;TXT或CSV格式文件的存储、读取(savetxt、loadtxt)
save函数以二进制的格式保存数据,load函数从二进制的文件中读取数据。二进制数据的存储:import numpy as nparr=np.arange(100).reshape(10,10)#创建一个数组np.save("C:/Users/ausu/tmp/save_arr",arr)#保存数组 print ('保存的数组为:\n',arr)保存的数组为: [[ 0 ...原创 2019-05-03 21:18:12 · 2537 阅读 · 0 评论 -
Python数据分析常用的23个牛逼Pandas代码
这儿是给数据分析师的23个Pandas代码,可以帮助你更好地理解数据!Pandas想必从事数据分析的各位都懂,这是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。还不熟悉的新手可以复制官网链接,10分钟快速了解下:http://pandas.pydata.org/pandas-docs/stable/10min.html应用案例集合也可以看看:h...原创 2019-07-05 11:27:00 · 2751 阅读 · 0 评论