python数据分析
文章平均质量分 79
Jmayday
人生就像一场修行,不断改变自己对世界的认知,去探索和发现未知事物的奥秘,一次令人回味无穷的旅途
展开
-
数据分析Level1知识点总结
数据分析Level1基本知识点整理总结原创 2022-06-21 16:02:59 · 971 阅读 · 0 评论 -
Echarts笔记
最近,在B站上学习了一些Echarts的使用,分享给大家。一个动态的柱状轮播图,本想着使用Pyecharts来实现的,奈何实现不了动态。看来做酷炫的可视化大屏还是得上Echarts和D3。Echarts文档地址https://echarts.apache.org/zh/option.html可供选择的配置超级多~还是在Vue.js这个框架下敲代码。首先需要安装Node.js以及NPM,然后安装Vue.js及Vue脚手架3.0。...转载 2020-10-26 13:38:18 · 273 阅读 · 0 评论 -
Python办公自动化之Excel做表自动化
0 Python Excel库对比我们先来看一下python中能操作Excel的库对比(一共九个库):1 Python xlrd 读取 操作Excel1.1 xlrd模块介绍(1)什么是xlrd模块? python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。 (2)为什么使用xlrd模块? 在UI自动化或者接口自动化中数据维护是一个核心,所以此模块非常实用。 xlrd模块可以用于读取Excel的数据,速度非常转载 2020-09-04 09:33:40 · 492 阅读 · 0 评论 -
seaborn制作动图
什么是Seaborn Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。 Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及sci...转载 2020-08-21 09:28:15 · 1871 阅读 · 1 评论 -
Pandas的25个使用技巧
显示已安装的版本输入下面的命令查询pandas版本:1In[7]:pd.__version__2Out[7]:0.24.2如果你还想知道pandas所依赖的模块的版本,你可以使用show_versions()函数: 1In[9]: 2pd.show_versions() 3 4INSTALLEDVERSIONS 5------------------ 6commit:None 7python:3.7.3.final.0 8python-bi...转载 2020-08-20 17:40:44 · 327 阅读 · 0 评论 -
python画简单图形
需要用到的模块:matplotlib和seaborn箱线图箱线图可以提供数据位置及其分散情况的关键信息,主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。如上图所示,箱线图主要包含几个关键的数据,上、下四方位数,中位数,上、下边缘以及异常值。简单来说,上四分位数表示全部数据中有四分之一的数据大于它,异常值表示远离上或下四分位数。我们来用箱线图观察一下宝可梦的各项属性的分散情况。df2=df.drop(['Generation','Total','Legendary'原创 2020-07-28 20:12:13 · 805 阅读 · 0 评论 -
基于python数据分析-pandas代码
我们常见的数据存储格式无非就是csv、excel、txt以及数据库等形式。数据读取在pandas中可以使用一些函数完成数据的读取。比如read_csv、read_excel、read_table、read_sql等,这些分别是啥意思呢。。。。自己看后缀就能明白啦~下面我们就通过撸代码来了解它们txt文件格式:read_table(文件路径与文件名, names=[列名1,列名2,.....], sep="",......)其中names为列名,默认为文件中的第一行作为列名sep为原创 2020-06-17 14:47:11 · 348 阅读 · 0 评论 -
sklearn基础及数据处理
sklearn 库整合了多种机器学习算法,可在数据分析过程快速建立模型。通过 pandas 库虽然已经提供数据合并、清洗、标准化(离差标准化、标准差标准化、小数定标标准化),为构建机器学习模型对数据特征还需处理更多预处操作,因此 sklearn 将相关预处理功能封装为统一接口 --- 转换器( Transformer )。使用 sklearn 转换器能够实现对传入的 NumPy 数组进行标准化处理、二值化、 PCA 将为等操作。 说到转换数据,实际上 padas 库也有提供了哑变量处理类别数...转载 2020-06-17 14:37:00 · 959 阅读 · 0 评论 -
matplotib入门练习
数据分析▲行文目录结构,重点是右三分支01 关于MatplotlibMatplotlib是Python的一个绘图库,与Numpy、pandas共享数据科学三剑客的美誉,也是很多高级可视化库的基础。Matplotlib不是Python内置库,调用前需手动安装,且需依赖Numpy库。截至当前,Matplotlib发行版本号为3.2.1,适配Python3.6及以上版本。Matplotlib,是matrix + plot + library的缩写,虽然命名很...转载 2020-06-11 09:20:30 · 358 阅读 · 0 评论 -
数据分析的几大黄金法则
大数据时代的到来使人类的认识变得更精确系统、更全面广泛、更快速有效。然而面对各种数据源收集来的海量数据,究竟如何对其进行归类、计算、建模和解释,却需要高超的智慧。因数据本身始终沉默,需要依赖认识主体的赋予。 为什么你的数据分析成果总是难以落地?数据分析的价值总是远远低于预期?相信看完这篇文章,每个人都能找到一个属于自己的答案。本人先后在电力、军工、金融等行业担任数据分析师,有多年行业经验。从平时的工作中总结出以下六个数据分析时要注意的原则,希望能对大家有所帮助。 1、遵...原创 2020-05-25 17:24:15 · 1346 阅读 · 0 评论 -
matplotlib绘图基础
开发工具:pycharm 个人观点:虽然安装了Anconda,sublime和pycahrm,感觉各自的风格不同,全屏自己的喜好和习惯,都是非常棒的。在这里绘图,我还是选择了pycharm,感觉有时候各种工具配合使用效果更佳,但是安装的时候可能有点烦。1、掌握基础绘图步骤# 导入模块from matplotlib import pyplot as plt# 给定x,y取值x = [1,2,3]y = [3,4,5]#传递参数plt.plot(x,y)# 绘图plt.sh.原创 2020-05-28 23:19:30 · 218 阅读 · 0 评论 -
matplotlib基础概念
数据分析概念:1、什么是数据分析? 数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们做出判断,以便于采取行动。2、数据分析的流程(1)提出问题(2)准备数据(3)分析数据(4)获取数据(5)成果可视化matplotlib知识点1、什么是matplotlib? matplotlib是最流行的python底层绘图库,主要做数据可视化图表,名字取材于matlab模块的构建2、为什么要学习matplotlib?(1)能将数据...原创 2020-05-28 22:54:57 · 418 阅读 · 0 评论