数据分析
文章平均质量分 82
python数据分析及可视化
爱喝水的小鲨鱼
Python领域优质创作者,获的过蓝桥杯国赛二等奖,主要学习方向有Python、机器学习、数据挖掘、数据分析、网络爬虫
展开
-
数据分析| Pandas200道练习题,使用Pandas连接MySQL数据库
在使用Pandas进行数据分析的过程中有些数据源是存在数据库中,我们需要使用Pandas进行数据的读取,以及将分析后的结果保存到数据库中。本文主要介绍了三种查询相关的函数,一种保存数据的函数。最后还讲解了Panda对数据的删除和更新操作。原创 2023-02-18 08:36:58 · 6645 阅读 · 194 评论 -
数据可视化 | Tableau从入门到高手 入门&联接关系&数据预处理
本节并没有涉及到绘图的操做介绍了Tableau的一些基础知识,面板的作用和功能,以及两种数据性质逻辑层物理层,还有关系和联接的区别和优势,最后我们还介绍了一些数据预处理的一些内容,修改字段,创建新字段合并字段等;原创 2022-11-25 10:23:47 · 8332 阅读 · 211 评论 -
数据分析 | Pandas 200道练习题 进阶篇(3)
本章仍然讲解一些常用的函数,保留指定小数位round(3),删除空值dropna,填充空值fillna,判断重复的行duplicated(),删除重复的行drop_duplicates(), 后面几个函数常用于数据清洗,数据清洗是数据分析之前一个必要的工作,清洗的好坏也影响后面数据的分析、数据建模原创 2022-11-19 09:15:00 · 2031 阅读 · 34 评论 -
Tableau安装详解及密钥申请
Tableau安装详解及学生账号的申请,Tableau Desktop 是基于斯坦福大学突破性技术的软件应用程序。是每一个数据可视化大神都使用的一款bi工具。原创 2022-11-17 09:15:00 · 19362 阅读 · 90 评论 -
数据分析 | Pandas 200道练习题 进阶篇(2)
本章9道试题使用了一些Pandas常见的函数进行解题,统计一列中不同值得内容和出现得次数,最大值,最小值,平均值,方差,标准差,中位数,众数,分位数等原创 2022-11-13 11:33:56 · 2001 阅读 · 126 评论 -
数据分析 | Pandas 200道练习题 进阶篇(1)
本篇文章设计道的内容较少,只讲解了4道题,也都比较简单,运用的知识都是以前学过的,这次的主要目的也是让大家熟悉一下牛客网的操作步骤。后续的题目的数量和难度都会提升原创 2022-11-12 10:30:00 · 3050 阅读 · 105 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(8)
本篇文章主要是一些窗口函数的使用,以及一些股票分析中常用的一些方法,日均线的了解与绘制,重采样,布林线指标。本篇文章涉及到的统计学知识较多,比较难以理解,对于统计学的知识作为一名数据分析师是必须要掌握的原创 2022-11-02 08:45:00 · 2172 阅读 · 75 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(7)
本章使用还是金融数据集,不仅回顾的旧的知识点,还拓展了一些新的内容,主要的难点在于重置索引`reset_index()`,计算一列的差分`diff()`,时间索引的操作,滑动窗口的使用`rolling()`原创 2022-11-01 09:00:00 · 3786 阅读 · 102 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(6)
本章使用的是一个股票的数据集,但是只进行一些基础的操作,数据导入,处理缺失值,查看缺失值的具体情况,绘制图像,在同一个图中绘制两个图,调整绘图的风格原创 2022-10-31 09:24:57 · 2290 阅读 · 26 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(5)
本章的10道题仍然是基于前章的文件,主要学习了有设置索引、合并两个DataFrame对象、更改数据类型,不同列之间的运算,统计一列不同值得个数以及不同值分别出现得次数,还有如何灵活的运用布尔值运算。原创 2022-10-30 08:46:37 · 2321 阅读 · 107 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(4)
本章我们学习了和合并列,添加新的行,删除指定列以及使用matplotlib绘制一些简单的图形等功能,这些功能都是以后常用的,我在讲解的时候也拓展了不同的解题方式,希望大家发展思路,多多尝试。原创 2022-10-29 05:45:00 · 3508 阅读 · 86 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)
今天的10道题涉及的东西多了一些,groupby、describe、cut、sort_values、info等,如果想要全部的了解这些,仅靠这10道题是远远不够的,希望大家能够额外找些试题练习,也可以跟着博主的文章一块刷题✨✨✨原创 2022-10-28 08:53:59 · 6438 阅读 · 108 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(2)
DataFrame存储为Excel,查看数据行列数,提取popularity列中值大于3小于7的行、交换两列的位置、提取popularity列最大的行所在行、查看最后3行数据、删除最后一行数据、添加一行数据、队数据按照popularity列的值的大小进行排序、统计grammer列每个字符串的长度原创 2022-10-27 05:30:00 · 4224 阅读 · 141 评论 -
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(1)
数据分析 | Pandas 200道练习题,每日10道题,学完必成大神,题目由浅到深,层层递进,让你不仅仅是知道Pasdas,更会灵活的使用。原创 2022-10-26 08:10:51 · 6548 阅读 · 25 评论 -
Pandas | value_counts() 的详细用法
用来统计数据表中,指定列里有多少个不同的数据值,并计算每个不同值有在该列中的个数,同时还能根据指定得参数返回排序后结果。,这个的过程是先按‘label’分组然后再统计每组的值,这样的效率较低,不建议使用。数据标准化以后,所有得项得和为1(可能因为计算机存储数据而有误差)常用来计算各数据占的比例。默认统计个数并降序返回。同样的统计还可以使用。原创 2022-08-24 17:26:28 · 22729 阅读 · 0 评论 -
Scrapy基础详解
scrapy框架scrapy框架框架是一个集成很多功能并且具有很强通用性的一个项目模板如何学习框架专门学习封装各种功能的详细用法什么是scrapy框架爬虫中的一个明星框架,功能:高性能的的持久性的的储存,异步的数据下载,高性能的数据解析,分布式scrapy框架基本使用环境的安装windows:pycharm 中直接就可以安装 pip install scrapy创建一个工程:scrapy startproject xxxcd xxx在spide原创 2021-10-11 19:58:22 · 1183 阅读 · 0 评论 -
数据分析--Matplotlib
Matplotlib基本布局对象图表样式的修改以及图表装饰的接口基础图表绘制直方图散点图饼图柱状图折线图表格不同坐标系下的图象matplotlib3D基本布局对象figure对象是所有图表绘制的基础构建图标的主要步骤准备数据生成图表传入数据调整图标的装饰图表样式的修改以及图表装饰的接口Matplotlib定义详细的图标装饰项接口,能够对图表几乎每一个细节进行修改修改图表样式import matplotlib.pyplot as pltimport numpy as npfi原创 2022-02-13 19:18:59 · 1218 阅读 · 0 评论 -
数据分析--pandas 处理结构化数据
pandas 处理结构化数据基本数据结构SeriesDataFrameDataFrame对象的访问基于pandas的index对象访问操作pandas的index对象索引的不同访问方式调用方式调用方式间的区别特殊参数类型数学统计和计算工具统计函数,协方差、相关系数、排序窗口函数数学聚合和分组运算agg函数的聚合操作transform函数的转换操作apply函数的一般操作基本数据结构Series类似于一维数组于字典的结合,是一个 有索引的一维数组。values 一组数据(ndarray类型)inde原创 2022-02-04 20:48:44 · 2122 阅读 · 0 评论 -
数据分析--NumPy
NumPy多维数组对象:ndarray对象ndarray对象的创建ndarray对象的数据类型ndarray对象的索引,切片和迭代ndarray对象的shape操作ndarray对象的基础操作不足多维数组对象:ndarray对象ndarray对象保存同一类型的数据,访问方式类似于列表,通过整数下标进行索引属性- shape 返回一个元组,用于表示ndarray各个维度的长度,- 元组的长度为数的维度,- 元组的每一个数值代表ndarray每一个维度的长度ndim ndarray的维度si原创 2022-01-29 22:00:29 · 685 阅读 · 0 评论 -
数据分析--数据分析相关库
-数据分析相关库NumPypandasMatplotlibscikit-learnScrapySciPyNLTKstatsmodelsJupyterNumPy是一个基础的科学计算库,是众多数据库的基础提供了多维数组对象的数据结构,可以用于数据量较大情况下的数组与矩阵的储存和计算,除此之外还提供了具有线形代数,傅里叶变换,和随机数生成的功能函数pandaspandas是构建在NumPy之上的一个高性能数据分析库。基本数据类型包括Series和DataFrame。分别用来处理一维数据和多维数据,原创 2022-01-14 20:26:22 · 1005 阅读 · 0 评论 -
数据分析--数据分析是什么?
数据分析是什么?数据分析与数据挖掘之间的关系数据分析数据挖掘数据分析的基本步骤python和数据分析数据分析就是通过得到的数据,来发现各种规律之间的关系数据分析与数据挖掘之间的关系数据分析定义:简单来说,数据分析就是对数据进行分析。专业的说法,数据分析是指根据分析目的,用适当的统计分析方法及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用。作用:它主要实现三大作用:现状分析、原因分析、预测分析(定量)。数据分析的目标明确,先做假设,然后通过数据分析来验证假设是否正确,从而得到原创 2022-01-10 16:01:14 · 2404 阅读 · 0 评论