玩转Python数据分析
文章平均质量分 89
我爱娃哈哈
公众号:服务端技术精选
展开
-
快乐学Python,通过用户和订单的数据分析,制定营销策略【实战】
在互联网行业中,电子商务领域绝对是数据分析用途最多的地方,各大电商平台都依赖数据分析帮助其挖掘用户订单增长机会。比如某宝的随手买一件,核心思路也就是根据用户的日常浏览内容及停留时间,以及订单的关联度来进行推荐的。原创 2024-02-19 19:42:16 · 903 阅读 · 0 评论 -
快乐学Python,如何正确使用pandas处理时间类型的数据?
因为时间的数据计算比较特殊,涉及到月份的天数、分钟折算成秒,需要除以60,小时折算成分钟,也需要除以60,如果自己手动计算,逻辑就会比较复杂。同时,根据数据记录方式的不同,时间的保存格式也是不同的。如果是中文环境,类似于“2024 年 2 月 1 日”这样的格式,也同样是可以解析的,我们可以通过 to_datetime 的自定义格式字符串来解析。在 Python 中,对时间数据的解析本质上就是将数据先转换为 pandas 的 Timestamp 类型,因为只有转换后才能进行后续的操作。原创 2024-02-01 18:01:31 · 973 阅读 · 0 评论 -
快乐学Python,如何对数据进行清洗?(缺失值处理和重复值删除)
数据清洗是处理缺失值和异常值的重要步骤。通过甄别缺失值,可以使用isna函数查询并聚合缺失的数据。处理缺失值的方式包括删除和补全,可以使用dropna和fillna函数。此外,还介绍了推测插值和重复值处理的方法。原创 2024-01-28 18:19:29 · 1103 阅读 · 0 评论 -
快乐学Python,DataFrame的基本操作
在上一篇文章中,我们了解了如何使用 pandas 的函数来从多种数据源:csv、excel 和 html 网页。其中不管是哪一种数据读取的方式,最终返回的都是一个 DataFrame 对象。对于 DataFrame 对象,我们只是简单将其打印出来,这一篇我们来学习围绕 DataFrame 的基本操作(添加行、列,删除行、列,排序等),除了 DataFrame,也会介绍另外一个重要的 pandas 数据结构: Series。原创 2024-01-26 23:08:58 · 1031 阅读 · 0 评论 -
快乐学Python,如何使用Python处理文件(csv、Excel、html)数据?
在前面的文章中,我们了解了Python爬虫的一些内容。截止到现在,我们已经可以将需要的数据通过爬虫获取,并保存到CSV文件中。在有了数据集后,接下来我们就开始了解如何将数据集的内容加载到Python中。虽然在之前也有了解简单的读取csv数据。Python 作为数据分析领域的头号种子选手,自然不会只有 csv 模块这样的初级工具。这个部分我们将会学习表格类型的大数据处理神器:pandas.pandas 不仅可以从多种不同的文件格式读取数据,还有各种各样的数据处理的功能。原创 2024-01-22 17:40:27 · 424 阅读 · 0 评论 -
快乐学Python,使用Python为电视剧主演生成词云
上篇文章我们串联了爬虫技术的几个基础环节,将电视剧的信息保存到了 csv 文件。这里,我们做个小实验:将主演信息生成词云。(其他文章可看专栏文章)原创 2024-01-19 17:26:40 · 380 阅读 · 0 评论 -
快乐学Python,使用爬虫爬取电视剧信息,构建评分数据集
在前面几篇文章中,我们了解了Python爬虫技术的三个基础环节:下载网页、提取数据以及保存数据。这一篇文章,我们通过实际操作来将三个环节串联起来,以国产电视剧为例,构建我们的电视剧评分数据集。原创 2024-01-19 09:46:08 · 746 阅读 · 0 评论 -
快乐学Python,使用Python将数据写入CSV文件中
Python读取csv文件,看你学会了吗原创 2024-01-17 12:04:20 · 2895 阅读 · 0 评论 -
快乐学Python,如何使用爬虫从网页中提取感兴趣的内容?
前面的内容,我们了解了使用urllib3和selenium来下载网页,但下载下来的是整个网页的内容,那我们又怎么从下载下来的网页中提取我们自己感兴趣的内容呢?这里就需要Python的另一个库来实现-BeautifulSoup。BeautifulSoup 是一个 Python 库,用于分析 HTML。它和它的名字一样,用起来非常“香”。今天我们通过使用 BeautifulSoup 去从上一篇文章案例中下载到的 html 文件:jiandan.html 中提取所有新闻的标题。原创 2024-01-15 16:25:10 · 960 阅读 · 0 评论 -
快乐学Python,数据分析之使用爬虫获取网页内容
在上一篇文章中,我们了解了爬虫的原理以及要实现爬虫的三个主要步骤:下载网页-分析网页-保存数据。下面,我们就来看一下:如何使用Python下载网页。原创 2024-01-14 18:48:11 · 1709 阅读 · 2 评论 -
快乐学Python,数据分析之获取数据方法「公开数据或爬虫」
数据获取是数据分析的第一步,可以通过获取现成的数据集或构建数据集。现成的数据集包括比赛数据集和行业数据集,而构建数据集则可以使用Python爬虫技术从互联网上抓取网页信息。在使用爬虫技术时,应注意适度降低抓取频率,避免给相关网站服务器造成负担,同时抓取到的数据仅作自己分析使用,不可传播或销售,以免违法原创 2024-01-10 11:03:11 · 1719 阅读 · 0 评论 -
快乐学Python,Python基础之组织代码「类与对象」
类与对象本质上是抽象与具象的关系,对象在类的基础上进行了适当的具象。所以在某个抽象关系中的对象也可能会成为另一个抽象关系中的类。原创 2024-01-08 21:29:06 · 886 阅读 · 0 评论 -
快乐学Python,Python基础之代码复用?「函数」
看到函数,可能你首先会条件反射地想到数学中的“函数”,但 Python 中的函数和数学中的不是一回事,不需要联合起来理解。Python 中的函数简单来说就是一段有名字的代码块。通过函数的机制,我们可以给我们希望重复使用的代码块起个名字,这样我们之后要用这个代码块的时候,就不需要重新写一遍一模一样的代码块,而只需要简单写一次之前给代码块起的名字即可。原创 2024-01-06 16:56:22 · 988 阅读 · 0 评论 -
快乐学Python,Python基础之如何控制代码执行顺序?【分支结构和循环结构】
Python基础-如何控制代码的执行顺序?原创 2023-12-28 17:59:24 · 837 阅读 · 0 评论 -
Python中的变量是什么?数据类型又有哪些?
Python 语言的基础构成要素:变量与数据类型。因为不仅是 Python,变量与数据类型可以说是所有编程语言的核心。掌握了语言的变量与数据类型的体系,可以说就掌握了这门语言的一大半儿。原创 2023-12-25 17:42:44 · 921 阅读 · 0 评论 -
搭建一个高效的Python开发环境
“工欲善其事,必先利其器”,这里我们来搭建一套高效的 Python 开发环境,为后续的数据分析做准备。原创 2023-12-24 17:44:01 · 831 阅读 · 0 评论 -
数据赋能,为什么选Python
互联网公司从红利下的爆发期,进入新的精细化发展阶段,亟须深入分析与挖掘业务与数据价值,从而找到新的增长点突破现有增长瓶颈。各行各业的数据分析需求井喷,数据分析人才成为争抢的对象,数据分析技能也成为一大职业亮点。。本篇文章,我们来聊一下为什么是 Python。原创 2023-12-19 20:48:00 · 344 阅读 · 1 评论