自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

乌贼君的博客

定期保存一些python相关知识内容

  • 博客(11)
  • 收藏
  • 关注

转载 高效的5个pandas函数,你都用过吗?

之前为大家介绍过10个高效的pandas函数,颇受欢迎,里面的每一个函数都能帮我们在数据分析过程中节省时间。pandas还有很多让人舒适的用法,这次再为大家介绍5个pandas函数,作为这个系列的第二篇。1. explodeexplode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同类型的数据,若想要展开成多行进行分析,这时候explode就派上用场,而且只需一行代码,非常节省时间。用法:DataFrame.explode(self, column: Un

2021-10-28 17:50:32 182

转载 25 个 Pandas 实用技巧,拿来即用

分享 25 个 Pandas 实用技巧。原文链接:https://nbviewer.jupyter.org/github/justmarkham/pandas-videos/blob/master/top_25_pandas_tricks.ipynb推荐阅读:怎么自学python,大概要多久? 哪些 Python 库让你相见恨晚? 你们都用Python实现了哪些办公自动化? 自动化神器!Python 批量读取身份证信息写入 Excel 用Python实现微信自动化抢红包,再也不用担心抢不

2021-10-26 10:27:29 171

转载 数据分析入门常用的 23 个牛逼 Pandas 代码,收好不谢

这儿有给数据分析师的23个Pandas代码,可以帮你更好地理解数据!Pandas想必从事数据分析的各位都懂,这是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。还不熟悉的新手可以复制官网链接,10分钟快速了解下:http://pandas.pydata.org/pandas-docs/stable/10min.html(1)读入 CSV 数据集pd.DataFrame.from_csv(“csv_file”)或者:pd.read_csv

2021-10-26 10:24:41 592

转载 天秀!Pandas还能用来写爬虫?

谈及Pandas的read.xxx系列的函数,大家的第一反应会想到比较常用的pd.read_csv()和pd.read_excel(),大多数人估计没用过pd.read_html()这个函数。虽然它低调,但功能非常强大,用于抓取Table表格型数据时,简直是个神器。下面来详细介绍一下。大家逛网页时,经常会看到这样一些数据表格,比如:电影票房数据世界大学排行榜数据财经数据如果查看一下网页的HTML结构(Chrome浏览器F12),会发现它们有个共同的特点,不仅是表格,还是以

2021-10-26 10:22:38 132

转载 提高数据的颜值!一起看看Pandas中的那些Style

Pandas的style用法在大多数教程中见的比较少,它主要是用来美化DataFrame和Series的输出,能够更加直观地显示数据结果。下面采用某商店的零售数据集,通过实际的应用场景,来介绍一下style中那些实用的方法。首先导入相应的包和数据集import pandas as pdimport numpy as npdata = data = pd.read_excel('./data/sales.xlsx')data.head()数据集中的特征有订单号、顾客姓名、商品名、

2021-10-26 10:19:23 549

转载 Pandas数据处理——盘点那些常用的函数

​这篇文章为大家整理一下实际使用中比较高频的一些用法,当然还会有一篇关于时间序列处理的文章。在这里需要强调一点就是,不建议初学者上来就把Pandas中所有的方法都啃一遍,这样效率太低而且很多方法平时基本用不到,啃下来也容易忘。正确的方式是先把常用的方法先吃透,然后找个项目直接上手,遇到现有方法处理不了的再查看官方文档。通过”人工智能“的方式,我从官方文档中筛选出一些比较常用的方法,有二十多个,初学者可以先试着把这些吃透了。为了避免过多看不下去,这篇文章就先介绍10个。用于演示的数据如下:I

2021-10-26 10:16:07 759

转载 提速百倍的Pandas性能优化方法,让你的Pandas飞起来!

Pandas是Python中用于数据处理与分析的屠龙刀,想必大家也都不陌生,但Pandas在使用上有一些技巧和需要注意的地方,尤其是对于较大的数据集而言,如果你没有适当地使用,那么可能会导致Pandas的运行速度非常慢。对于程序猿/媛而言,时间就是生命,这篇文章给大家总结了一些pandas常见的性能优化方法,希望能对你有所帮助!一、数据读取的优化读取数据是进行数据分析前的一个必经环节,pandas中也内置了许多数据读取的函数,最常见的就是用pd.read_csv()函数从csv文件读取数据,那不

2021-10-26 10:12:30 3349

转载 Pandas数据处理——玩转时间序列数据

进行金融数据分析或量化研究时,总避免不了时间序列数据的处理,时间序列是指在一定时间内按时间顺序测量的某个变量的取值序列。常见的时间序列数据有一天内随着时间变化的温度序列,又或者交易时间内不断波动的股票价格序列。Pandas也因其强大的时序处理能力而被广泛应用于金融数据分析,这篇文章为大家介绍一下Pandas中的时间序列处理,所使用的数据是上证指数2019年的行情数据。时间相关的数据类型Pandas时序处理中最常见的两种数据类型为datetime和timedelta。一个datetime可以如下图

2021-10-26 10:11:17 700

转载 Pandas教程 | Merge数据合并图文详解

为了方便维护,一般公司的数据在数据库内都是分表存储的,比如用一个表存储所有用户的基本信息,一个表存储用户的消费情况。所以,在日常的数据处理中,经常需要将两张表拼接起来使用,这样的操作对应到SQL中是join,在Pandas中则是用merge来实现。这篇文章就讲一下merge的主要原理。上面的引入部分说到merge是用来拼接两张表的,那么拼接时自然就需要将用户信息一一对应地进行拼接,所以进行拼接的两张表需要有一个共同的识别用户的键(key)。总结来说,整个merge的过程就是将信息一一对应匹配的过程,下面

2021-10-26 10:09:54 3344

转载 Pandas教程 | 超好用的Groupby用法详解

在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。在Pandas中,上述的数据处理操作主要运用groupby完成,这篇文章就介绍一下groupby的基本原理及对应的agg、transform和apply操作。为了后续图解的方便,采用模拟生成的10个样本数据,代码和数据如下:company=["A","B","C"

2021-10-26 10:04:41 3109

转载 Pandas教程 | 数据处理三板斧——map、apply、applymap详解

在日常的数据处理中,经常会对一个DataFrame进行逐行、逐列和逐元素的操作,对应这些操作,Pandas中的map、apply和applymap可以解决绝大部分这样的数据处理需求。这篇文章就以案例附带图解的方式,为大家详细介绍一下这三个方法的实现原理,相信读完本文后,不论是小白还是Pandas的进阶学习者,都会对这三个方法有更深入的理解。本文演示的数据集是模拟生成的,想练手的可以按下方的代码生成。boolean=[True,False]gender=["男","女"]color=["whit

2021-10-26 10:02:38 686 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除