Python数据分析
文章平均质量分 61
从零开始学习数据分析,先学基础再做项目。
老贡讲Python
Python学习就找我 从此一路小平坡
展开
-
吹爆了这个可视化神器,上手后直接开大~
今天给大家推荐一个可视化神器 - Plotly_express ,上手非常的简单,基本所有的图都只要一行代码就能绘出一张非常酷炫的可视化图。以下是这个神器的详细使用方法,文中附含大量的 GIF 动图示例图。注:源代码(.ipypnb文件)的获取方式,私我“可视化图”即可~1. 环境准备本文的是在如下环境下测试完成的。 Python3.7 Jupyter notebook Pandas1.1.3 Plotly_express0.4.1 其...转载 2022-05-18 15:34:33 · 1494 阅读 · 1 评论 -
【Python自动化Excel】Python与pandas字符串操作
Python之所以能够成为流行的数据分析语言,有一部分原因在于其简洁易用的字符串处理能力。Python的字符串对象封装了很多开箱即用的内置方法,处理单个字符串时十分方便;对于Excel、csv等表格文件中整列的批量字符串操作,pandas库也提供了简洁高效的处理函数,几乎与内置字符串函数一一对应。也就是说: 单个字符串处理,用Python内置的字符串方法; 表格整列的字符串处理,用pandas库中的字符串函数; 本文就以常用的数据处理需求,来对比使用以上两种方式的异同,从而加深对P.原创 2022-03-31 15:41:32 · 3157 阅读 · 0 评论 -
用Python可视化分析全球火山分布,发现了这些有趣的现象
也就在前几天,南太平洋岛国汤加发生火山喷发,有专门的专家学者分析,这可能是30年来全球规模最大的一次海底火山喷发,它引发的海啸以及火山灰将对周边的大气、洋流、淡水、农业以及民众健康等都造成不同程度的影响。今天小编就用Python当中的folium模块以及其他的可视化库来对全球的火山情况做一个分析。准备工作和以往一样,我们先导入需要数据分析过程当中需要用到的模块并且读取数据集,本次的数据集来自由kaggle网站,主要由美国著名的史密森学会整理所得importpanda..原创 2022-01-19 13:34:35 · 939 阅读 · 0 评论 -
NumPy 库在 Python 中的妙用之NumPy处理数字
这篇文章讨论了安装 NumPy,然后创建、读取和排序 NumPy 数组。NumPy(即NumericalPython)是一个库,它使得在 Python 中对线性数列和矩阵进行统计和集合操作变得容易。我在 Python 数据类型的笔记中介绍过,它比 Python 的列表快几个数量级。NumPy 在数据分析和科学计算中使用得相当频繁。我将介绍安装 NumPy,然后创建、读取和排序 NumPy 数组。NumPy 数组也被称为 ndarray,即 N 维数组的缩写。安装 NumPy使用...原创 2022-01-16 10:00:00 · 425 阅读 · 0 评论 -
入门Python数据分析最好的实战项目(一)
作者:xiaoyu微信公众号:Python数据科学目的:本篇给大家介绍一个数据分析的初级项目,目的是通过项目了解如何使用Python进行简单的数据分析。数据源:博主通过爬虫采集的链家全网北京二手房数据(公众号后台回复 二手房数据 便可获取)。数据初探首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seaborn,以及机器学习包sklearn。import pandas as pdimport numpy as npimport seab.转载 2021-11-23 20:30:00 · 1433 阅读 · 0 评论 -
Matplotlib 25张图,数据分析可视化利器,不收藏女友要和我分手
Matplotlib 我们经常会使用到,今天给大家分享25 个Matplotlib图的汇编,在数据分析和可视化中最有用。此列表允许您使用Python的Matplotlib和Seaborn库选择要显示的可视化对象。1. 关联散点图 带边界的气泡图 带线性回归最佳拟合线的散点图 抖动图 计数图 边缘直方图 边缘箱形图 相关图 矩阵图2. 偏差发散型条形图 发散型文本 发散型包点图 带标记的发散型棒棒糖图 面积图3. 排序有序条形图 棒棒糖图 包点图 坡度图 哑铃图...原创 2021-12-08 20:30:00 · 369 阅读 · 0 评论 -
学会了Python就可以做数据分析师?别天真了
数据分析师已经存在多年了,但是,对该职业的需求从2018年开始,对数据分析师的需求猛增,目前数据分析师的前景已然非常好!预计到2025年,「数据分析师」将成为需求最大的工作之一。由于这种现象,我们看到了数据分析师的兴起。许多研究预测,这一角色将成为未来的工作的主力军。很多想转型做数据师的朋友,职业方向的转变也并非一朝一夕的事情,你需要对这个行业有一定的了解,并匹配一下自己的知识和能力结构。有很多还没有入行的同学通常一个认知误区:以为只要学了Python就可以做数据分析师。这是错误的!我们先来理解原创 2021-12-12 20:47:13 · 4465 阅读 · 0 评论 -
详解一个Python库,用于构建精美数据可视化web app,练习做个垃圾分类app
今天详解一个 Python 库 Streamlit,它可以为机器学习和数据分析构建 web app。它的优势是入门容易、纯 Python编码、开发效率高、UI精美。上图是用 Streamlit 构建自动驾驶模型效果的 demo,左侧是模型的参数,右侧是模型的效果。通过调整左侧参数,右边的模型会实时地响应。由此可以看出,对于交互式的数据可视化需求,完全可以考虑用 Streamlit 实现。特别是在学习、工作汇报的时候,用它的效果远好于 PPT。因为 Streamlit 提供了很多前端交互.原创 2021-11-23 20:15:19 · 2449 阅读 · 0 评论 -
5G出来这么久了,到底5G对我们的生活带来了哪些便利呢?Python实现5G数据可视化,带你切实体验5G
前言利用Python实现5G 手机价格 及芯片、5G下载网速,5G网络城市数据可视化,废话不多说~让我们愉快地开始吧~开发工具Python版本: 3.6.4相关模块:pyecharts模块;以及一些Python自带的模块。环境搭建安装Python并添加到环境变量,pip安装需要的相关模块即可。今天将对5G 手机价格 及芯片、5G下载网速,5G网络城市等相关数据进行可视化各品牌5G手机价位比较一共有17个品牌,其中realme是一个新兴的手机品牌,2018年才创原创 2021-12-16 17:31:14 · 592 阅读 · 0 评论 -
酷毙了,Python“元宇宙”实现赛博朋克数据可视化
“元宇宙”是什么?虚拟现实“元宇宙”长啥样?看看就知道了“元宇宙”怎么玩?跟着我,带你先看看他的样子吧!前言利用Python实现赛博朋克数据可视化,废话不多说~让我们愉快地开始吧~开发工具Python版本: 3.6.4相关模块:mplcyberpunk模块;matplotlib模块;numpy模块;以及一些Python自带的模块。环境搭建安装Python并添加到环境变量,pip安装需要的相关模块即可。赛博朋克2077》是一款由CD Proje.原创 2021-12-16 16:38:37 · 2179 阅读 · 1 评论 -
【Python数据分析-1】:Pandas的常用操作-Pandas的主要数据结构Series(一维数据)和DataFrame(二维数据)
大家好,这里是为代码封神的封神榜(有点吹牛皮了,哈哈)。还是新人初来乍到,希望大家多多指教。本系列呢,是为大家带来的是Python数据分析,希望大家能够喜欢,多多支持。安装Pandas从PyPi安装:pip install Pandas复制代码Pandas适用场景Pandas 适用于处理与Excel表类似的二维表格数据堆数 名称 描述 1 Series 代表钱的数据类型相同的数组 2 DataFrame 带标签的大小可变的不同数原创 2021-11-20 10:00:00 · 2440 阅读 · 0 评论 -
【Python数据分析-5】:Pandas常用操作-二维数据合并concat
concatPandas提供了把多个DataFrame合并链接成一个DataFrame的concat的方法:In [2]: import pandas as pdIn [3]: import numpy as npIn [4]: data = pd.DataFrame(np.random.randn(10, 4))In [5]: dataOut[5]: 0 1 2 30 -0.150377 0.473775 -0原创 2021-11-20 20:00:00 · 587 阅读 · 0 评论 -
【Python数据分析-6】:Numpy常用操作-NumPy数组和原生Python Array(数组)的区别
NumPy数组和原生Python Array(数组)的区别NumPy数组和原生Python Array(数组)之间有几个重要的区别:NumPy 数组在创建时具有固定的大小,与Python的原生数组对象(可以动态增长)不同。更改ndarray的大小将创建一个新数组并删除原来的数组。 NumPy 数组中的元素都需要具有相同的数据类型,因此在内存中的大小相同。 例外情况:Python的原生数组里包含了NumPy的对象的时候,这种情况下就允许不同大小元素的数组。 NumPy 数组有助于对大量数据进行高原创 2021-11-21 08:00:00 · 1347 阅读 · 0 评论 -
【Python数据分析-8】:Numpy常用操作-arange函数、linspace函数与运算
1 arange函数创建类似Python 的range函数功能的Numpy数组的方法:下面的例子创建一个从1开始到10,步长为2的一维Numpy数组In [21]: np.arange(1, 10, 2)Out[21]: array([1, 3, 5, 7, 9])2 linspace函数但是当需要创建小数构成的数组时,由于一个整数到另一个整数之间存在无数个小数,使用arange就不能实现了。所以Numpy提供了linspace函数:下面的例子生成0到10之前等距的10个数:#原创 2021-11-21 12:00:00 · 1749 阅读 · 0 评论 -
【Python数据分析-7】:Numpy常用操作-Numpy基础与创建
1 Numpy基础Numpy的数据是同构多维的数据,意味着里面的元素都是同一张数据类型的,一般都是数值型。在Numpy中,一维称为一轴。Numpy中多维数组ndarray需要了解的属性:ndarray.ndim- 数组维度的个数。 ndarray.shape- 数组的维度,相当于科幻小说的几维空间的意思。对于有m行和n列的多维数组,shape将是(m,n)。因此,shape元组的长度就是维度的个数ndim。 ndarray.size- 多维数组里面所有元素的个数。 n...原创 2021-11-21 10:00:00 · 149 阅读 · 0 评论 -
【Python数据分析-2】:Pandas常用操作-生成Series/DataFrame对象的方法
生成Series/DataFrame对象的方法建议使用交互式Python解释器进行下面的操作:引入numpy和pandas库:import numpy as npimport pandas as pd复制代码用列表生成Series时,索引会自动使用从0到len(列表)-1的数值。In [1]: import numpy as npIn [2]: import pandas as pdIn [3]: data = pd.Series([1, 2, 3, 4, 5])In原创 2021-11-20 12:00:00 · 775 阅读 · 0 评论 -
【Python数据分析-3】:Pandas常用操作-数据选择的常用方法
数据选择的常用方法在ipython解释器下,构造测试数据:In [1]: import numpy as npIn [2]: import pandas as pdIn [3]: dates = pd.date_range('20211107', periods=6)In [4]: data = pd.DataFrame(np.random.randn(6, 4), index=d ...: ates, columns=['A', 'B', 'C', 'D'])In [5]:原创 2021-11-20 14:00:00 · 293 阅读 · 0 评论 -
【Python数据分析-9】:Numpy常用操作-通函数、多维数组的迭代简介
1 通函数通函数的概念:Numpy直接提供的数学函数成为通函数。例如:sum、add、cell、floor等。In [1]: import numpy as npIn [2]: data = np.arange(1, 9)In [3]: dataOut[3]: array([1, 2, 3, 4, 5, 6, 7, 8])In [4]: np.sum(data)Out[4]: 36In [5]: data2 = np.arange(1, 9)In [6]: data2Ou原创 2021-11-23 15:58:30 · 367 阅读 · 0 评论