pandas
文章平均质量分 85
可以叫我才哥
关注我的公众号呗,一起学习
微信公众号:可以叫我才哥
展开
-
答疑解惑:用pandas的shift函数解决一个数据处理问题
大家好,我是才哥。本系列将用于记录在日常中遇到的一些问题的答疑解惑,这些问题可能来自咱们可爱的粉丝又或者来自咱自己。行文会比较间接,解决方案不一定最优,欢迎大家交流~让我们正式开始吧!今天有个粉丝问了一个Pandas的数据处理问题,似曾相似,咱们一起看看吧!df,有name,job两列,筛选条件,job=0,并且这行name和上一行(前值)不同把符合条件行的job从0改为1我们就基于自己的思路,自己构建模拟数据直接开干了!In [1]: import pandas as pdIn原创 2021-09-16 21:23:46 · 314 阅读 · 0 评论 -
实战|用Python爬取《云南虫谷》3.6万条评论,并做数据统计可视化展示分析,好看!
大家好,我是才哥。最近鬼吹灯系列网剧《云南虫谷》上线,作为鬼吹灯系列作品,承接上部《龙岭迷窟》内容,且还是铁三角原班人马主演,网友直呼非常好看!今天,我们就用Python爬取目前全部剧集的评论(含预告片),并做数据统计与可视化展示分析,一起跟着网友看看这部剧吧!本文将详细讲解爬虫与数据处理可视化,寓教于乐!后台回复 210905 领取 代码+数据目录:文章目录1. 网页分析2. 爬虫过程2.1. 引入需要的库2.2. 爬取剧集页面数据2.3. 解析剧集ID和剧集评论ID2.4. 采集全部剧集评论原创 2021-09-05 18:01:39 · 625 阅读 · 3 评论 -
只需8招,搞定Pandas数据筛选与查询
大家好,我是才哥。今天聊聊Pandas数据筛选与查询的一些操作,在数据分析的过程中通常要对数据进行清洗与处理,而其中比较重要和常见的操作就有对数据进行筛选与查询。目录:文章目录1. 案例数据预览2. 基础操作2.1. 切片[]2.2. 索引选择.iloc与.loc2.3. 元素选择.iat与.at2.4. get与truncate3. 进阶操作3.1. 逻辑筛选3.2. 函数筛选3.3. query3.4. filter1. 案例数据预览本次案例,我们继续采用之前用到过的各地区GDP数据,数据信原创 2021-09-02 16:59:54 · 1295 阅读 · 0 评论 -
对比Excel,用Pandas轻松搞定IF函数操作(df.where与df.mask)
大家好,我是才哥。在 Excel 中IF 函数是最常用的函数之一,它可以对值和期待值进行逻辑比较。 因此IF 语句可能有两个结果: 第一个结果是比较结果为 True,第二个结果是比较结果为 False。例如,=IF(C2=”Yes”,1,2) 表示 IF(C2 = Yes, 则返回 1, 否则返回 2)。那么,在Pandas里我们可以怎么来轻松搞定这一操作呢?今天,我们就来了解一下!目录:文章目录1. 案例需求2. Excel轻松搞定3. Pandas处理4. 延伸1. 案例需求原始数据如下原创 2021-09-02 16:59:17 · 4191 阅读 · 2 评论 -
一看就会的Pandas文本数据处理
大家好,我是才哥。日常工作中我们经常接触到一些文本类信息,需要从文本中解析出数据信息,然后再进行数据分析操作。而对文本类信息进行解析是一件比较头秃的事情,好巧,Pandas刚好对这类文本数据有比较好的处理方法,那就让我们来一起学一学吧!1. 文本数据类型在pandas中存储文本数据有两种方式:object 和 string。在pandas 1.0版本之前,object是唯一的文本类型,在一列数据中如果包含数值和文本等混合类型则一般也会默认为object。在pandas 1.0 版本之后,新增了str原创 2021-08-08 21:42:34 · 1229 阅读 · 19 评论 -
对比Excel,一文掌握Pandas表格条件格式(可视化)
大家好,我是才哥。本来这周不是加班周,但是毕竟项目赶进度,还是需要加班着,咱们更文又变得慢了起来。最近有粉丝询问Pandas表格可视化的一些问题,刚好前段时间也看过,那么就结合之前处理Excel时的条件格式对着来看吧。所以,今天咱们隆重介绍一下Excel条件格式与Pandas的表格可视化,走起!目录:文章目录1. 概述2. 突出显示单元格2.1. 高亮缺失值2.2. 高亮最大值2.3. 高亮最小值2.4. 高亮区间值2.5. 高亮分位数3. 色阶(背景及文本渐变色)3.1. 背景渐变色3.2. 文原创 2021-08-07 12:07:48 · 592 阅读 · 0 评论