数据分析
文章平均质量分 87
小数志
欢迎关注个人公众号:小数志
展开
-
Numpy中的广播机制,你确定正确理解了吗?
导读Numpy是Python中的一个基础的数据分析工具包,其提供了大量常用的数值计算功能,当然这些数值计算函数大多依赖于其核心的数据结构:ndarray,也就是N维数组。而关于这个ndar...原创 2021-08-22 12:00:00 · 412 阅读 · 0 评论 -
最近,又发现了Pandas中三个好用的函数
导读笔者早先学习Python以及数据分析相关知识时,对Pandas投入了很多精力,自认掌握的还算扎实,期间也总结分享了很多Pandas相关技巧和心得(点击上方“Pandas”标签可以查看系...原创 2022-02-22 12:00:00 · 868 阅读 · 0 评论 -
且用且珍惜:Pandas中的这些函数/属性将被deprecated
导读Pandas对于日常数据分析和处理来说是最常用的工具(没有之一),笔者之前也总结分享了很多相关用法和技巧。与之不同,今天本文来介绍几个已经在函数文档中列入"deprecated"的函数/属性,可能在不久的未来版本中这些用法将正式与我们告别,以此权当留念。deprecated:英文原义有不赞成和反对的意思,在编码文件中常用于标记某方法已不提倡使用和即将废弃,虽然暂时可用...原创 2022-03-22 12:00:00 · 2203 阅读 · 0 评论 -
Pandas用的6不6,来试试这道题就能看出来
导读近日,在实际工作中遇到了这样一道数据处理的实际问题,凭借自己LeetCode200+算法题和Pandas熟练运用一年的功底,很快就完成了。特此小结,以资后鉴!题目描述:给定一组用户的...原创 2021-01-08 12:00:00 · 65 阅读 · 0 评论 -
Pandas、Matplotlib、Pyecharts数据分析实践
上篇中,我们对比了各种方式下的爬虫效率,并得到了安居客平台杭州的二手房数据3000条。今天,以此3000条数据为对象,我们尝试应用Pandas、Matplotlib和Pyecharts3...原创 2020-02-17 22:55:23 · 191 阅读 · 0 评论 -
Pandas中的这3个函数,没想到竟成了我数据处理的主力
导读学Pandas有一年多了,用Pandas做数据分析也快一年了,常常在总结梳理一些Pandas中好用的方法。例如三个最爱函数、计数、数据透视表、索引变换、聚合统计以及时间序列等等,每一...原创 2021-01-24 19:13:15 · 263 阅读 · 0 评论 -
Pandas中groupby的这些用法你都知道吗?
导读pandas作为Python数据分析的瑞士军刀,集成了大量实用的功能接口,基本可以实现数据分析一站式处理。前期,笔者完成了一篇pandas系统入门教程,也针对几个常用的分组统计接口进...原创 2020-07-12 12:00:00 · 220 阅读 · 0 评论 -
详解Pandas读取csv文件时2个有趣的参数设置
导读Pandas可能是广大Python数据分析师最为常用的库了,其提供了从数据读取、数据预处理到数据分析以及数据可视化的全流程操作。其中,在数据读取阶段,应用pd.read_csv读取cs...原创 2021-06-24 12:00:00 · 527 阅读 · 1 评论 -
Pandas中实现聚合统计,有几种方法?
导读Pandas是当前Python数据分析中最为重要的工具,其提供了功能强大且灵活多样的API,可以满足使用者在数据分析和处理中的多种选择和实现方式。今天本文以Pandas中实现分组计数这...原创 2021-06-06 12:00:00 · 1145 阅读 · 0 评论 -
pandas时间序列常用方法简介
导读pandas是Python数据分析最好用的第三方库,没有之一。——笛卡儿没说过这句话!在进行时间相关的数据分析时,时间序列的处理是自然而然的事情,从创建、格式转换到筛选、重采样和聚合...原创 2020-08-08 18:00:00 · 456 阅读 · 0 评论 -
从pandas中的这几个函数,我看懂了道家“一生二、二生三、三生万物”
导读pandas是用python进行数据分析最好用的工具包,没有之一!从数据读写到预处理、从数据分析到可视化,pandas提供了一站式服务。而其中的几个聚合统计函数,不仅常用更富有辩证思...原创 2020-05-27 12:15:00 · 86 阅读 · 0 评论 -
Pandas用了这么久,有觉得哪里不好的地方吗?
导读作为一名数据分析师,自己对Pandas有过系统的学习和应用实践,对其大部分功能甚至骚操作也称得上有所研究,前期也写过太多的Pandas应用技巧相关的文章。那么在赞美之余,有没有一些觉得...原创 2021-06-27 22:22:37 · 282 阅读 · 0 评论 -
一文介绍Pandas中的9种数据访问方式
导读Pandas之于日常数据分析工作的重要地位不言而喻,而灵活的数据访问则是其中的一个重要环节。本文旨在讲清Pandas中的9种数据访问方式,包括范围读取和条件查询等。Pandas中的核心...原创 2021-07-15 12:00:00 · 1205 阅读 · 0 评论 -
Pandas用到今天,没成想竟忽略了这个函数
导读Pandas曾经一度是我数据分析的主力工具,甚至在当下也是很多情况下的首选。作为Python数分三剑客之一,Pandas素以API丰富著称,个人也是常常沉醉于其中的各种骚操作而不能自拔...原创 2021-04-14 22:27:50 · 113 阅读 · 0 评论 -
用Pandas做数据清洗,我一般都这么干……
导读作为一名数据分析师,每天都在完成各种数据分析需求,其中数据清洗是必不可少的一个步骤。一般而言,当提及数据清洗时,其实是主要包括了缺失值处理、重复值处理和异常值处理三类操作,本文即围绕...原创 2020-11-30 12:00:00 · 306 阅读 · 0 评论 -
python数据科学系列:pandas入门详细教程
导读前2篇分别系统性介绍了numpy和matplotlib的入门基本知识,今天本文自然是要对pandas进行入门详细介绍,通过本文你将系统性了解pandas为何会有数据分析界"瑞...原创 2020-05-05 21:15:00 · 389 阅读 · 0 评论 -
python数据科学系列:numpy入门详细教程
导读python数据科学基础库主要是三剑客:numpy,pandas以及matplotlib,每个库都集成了大量的方法接口,配合使用功能强大。平时虽然一直在用,也看过很多教程,但纸上得来...原创 2020-05-02 21:46:20 · 325 阅读 · 0 评论 -
python数据科学系列:matplotlib入门详细教程
导读上篇中,介绍了numpy的常用接口及使用,并对部分接口方法进行了详细对比。与之齐名,matplotlib作为数据科学的的另一必备库,算得上是python可视化领域的元老,更是很多高级...原创 2020-05-04 12:10:00 · 418 阅读 · 0 评论 -
一句SQL,我有6种写法
导读最近在刷LeetCode中数据库题目时,有一道排名题目,用了6种写法分别代表6种SQL思维来实现,想想也算是有趣。题目描述:题意理解不难,无非就是查找排名为N的记录,但常用SQL的都...原创 2020-04-30 12:10:00 · 86 阅读 · 1 评论 -
因Pandas版本较低,这个API实现不了咋办?
前几天发表了一篇推文,分享了Pandas中非常好用的一个API——explode,然而今天又发生了戏剧性的一幕:因Pandas版本过低系统提示’Series’ object has no attribute ‘explode’!好吧,好用的东西永远都是娇贵的,这个道理没想到在代码中也适用。所以,今天就以此为题展开拓展分析,再输出一点Pandas干货……问题描述:一个pandas dataframe数据结构存在一列是集合类型(即包含多个子元素),需要将每个子元素展开为一行。这一场景运用pandas中的ex原创 2021-01-18 23:45:37 · 206 阅读 · 0 评论 -
详解pd.DataFrame中的几种索引变换
详解pd.DataFrame中的几种索引变换导读:pandas中最常用的数据结构是DataFrame,而DataFrame相较于嵌套list或者二维numpy数组更好用的原因之一在于其提供了行索引和列名。本文主要介绍行索引的几种变换方式,包括rename与reindex、index.map、set_index与reset_index、stack与unstack等。惯例开局一张图01 索引简介与样例数据Series和DataFrame是pandas中的主要数据结构类型(老...原创 2020-11-07 03:02:11 · 5641 阅读 · 0 评论 -
最近,我用pandas处理了一把大数据……
导读:pandas是python数据分析的不二选择,堪称瑞士军刀般的存在,几乎可以胜任数据分析的全过程。如果说有什么缺点的话,那么就是其不支持分布式,所以对于小数据量完全不压力,但面对大数据时却当真有些乏力。近日,自己便用pandas处理了一些大数据场景,现分享几个心得技巧。首先简单介绍下场景:数据是每个月一份的csv文件,字段数目10个左右,单个文件记录数约6-8亿之间,单个文件体积50G+的样子。表中是一条条的带有时间字段的数据,需求是对数据进行汇总统计和简单分析处理(一般而言,数据..原创 2020-11-02 20:32:31 · 194 阅读 · 0 评论 -
Pandas用了一年,这3个函数是我的最爱……
导读:作为一名数据分析师,也是Pandas重度依赖者,虽然其提供了大量便利的接口,但其中的这3个却使用频率更高!原创 2020-11-01 20:25:27 · 435 阅读 · 1 评论