pandas

最新推荐文章于 2024-07-30 20:28:19 发布

散懒的猫

最新推荐文章于 2024-07-30 20:28:19 发布

阅读量41

点赞数

文章标签： pandas python 数据挖掘

本文链接：https://blog.csdn.net/Bruce_zfh/article/details/130567141

版权

data : array-like, Series, or DataFrame 输入的数据
prefix : string, get_dummies转换后，列名的前缀，默认为None
columns : 指定需要实现类别转换的列名否则转换所有类别性的列

data = pd.read_csv('C:\\Users\\zsl\\Desktop\\Q\\data-set\\banking.csv')

cat_vars = ['job', 'marital', 'education', 'month', 'day_of_week', 'poutcome', 'default', 'housing', 'loan', 'contact']

for i in cat_vars:
    cat_list = pd.get_dummies(data=data, prefix=i)

不能这样写，因为columns未指定的话默认对data中所有的数据集进行独热了，放在for中相当于反复鞭尸

data_df = pd.DataFrame({'id':[1,2,3],'gender':['m','f','n']})
df_onehot = pd.get_dummies(data_df, prefix ='gen')

prefix相当于在独热升维的每列数据前面加个名字

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

散懒的猫

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas

不能这样写，因为columns未指定的话默认对data中所有的数据集进行独热了，放在for中相当于反复鞭尸。prefix相当于在独热升维的每列数据前面加个名字。
复制链接

扫一扫

Pandas实战100例-专栏介绍

惊鸿若梦一书生

01-13

1898

Pandas，Python数据科学的心脏，是探索和分析数据世界的强大工具。想象一下，用几行代码就能洞察庞大数据集的秘密，无论是金融市场趋势还是社交媒体动态。通过Pandas，你可以轻松地整理、清洗、转换数据，将杂乱无章的数据变成有意义的洞察。它的灵活性和效率是数据科学家和分析师的必备利器。学习Pandas，就是开启数据探索之旅的第一步，让数据讲述背后的故事。你准备好了吗？加入Pandas的世界，成为数据的大师。

Pandas

weixin_54936485的博客

09-09

1840

Numpy已经能够帮助我们处理数据，能够结合matplotlib解决部分数据展示等问题，那么pandas学习的目的在什么地方呢？增强图表可读性回忆我们在numpy当中创建学生成绩表样式：返回结果：如果数据展示为这样，可读性就会更友好：便捷的数据处理能力Pandas中一共有三种数据结构，分别为：Series、DataFrame和MultiIndex（老版本中叫Panel ）。其中Series是一维数据结构，DataFrame是二维的表格型数据结构，MultiIndex是三维的数据结构。Series是一个类

参与评论您还未登录，请先登录后发表或查看评论

Python安装Pandas库

热门推荐

weixin_43222191的博客

08-17

10万+

Python安装Pandas库的三种方法

Pandas手册.pdf

02-03

Pandas 手册 Pandas 是 Python 中的一个开源库，提供了高效的数据处理和分析工具。该手册概括了 Pandas 的主要特性和方法，涵盖了数据帧、reshaping 数据、数据排序、索引、重命名、数据合并、逻辑运算、正则表达式...

Pandas版本1

08-04

"Pandas版本1" Pandas是一个基于Python的数据分析库，提供了高效、灵活的数据结构和数据分析工具。下面是Pandas版本1的知识点总结： 1. 数据结构：Pandas提供了两种基本的数据结构：Series（一维数据）和DataFrame...

pandas1.4.3官方文档

06-25

pandas 1.4.3官方文档 pandas是一个功能强大且流行的Python数据分析工具箱，提供了高效、灵活和可扩展的数据处理和分析解决方案。下面是根据官方文档生成的相关知识点：安装 pandas可以通过pip进行安装，命令...

【Python】pandas：排序、重复值、缺省值处理、合并、分组

yannan20190313的博客

07-30

865

【Python】pandas：排序（sort_index,sort_values,nsmallest,nlargest）、重复值（duplicated,drop_duplicates,value_counts,nunique）、缺省值处理（isna,isnull,notna,notnull,fillna,dropna,replace）、合并（join,merge,append,concat）、分组（groupby）

快醒醒，别睡了!...讲《数据分析pandas库》了—/—＜4＞

qq_64603703的博客

07-27

1006

详细解说数据分析pandas库中的常用方法

全网最详细Gradio教程系列5——Gradio Client: python

shao918516的博客

07-26

1103

程序部署完成后，如何将Gradio App作为API访问使用呢，这就用到Gradio Client。本章讲解Gradio Client的三种使用方式：python、javascript和curl，受字数限制，所以分三篇博客发布。使用Gradio Python Client非常易于将Gradio应用程序作为API使用，本节讲述gradio_client安装、如何连接Gradio应用程序、查看可用API及其使用方式、job及session等用法。通过Gradio Python Cli

Chapter 18 Python异常

2302_80253507的博客

07-28

1238

在Python中，异常是一种特定的对象，能够在程序运行过程中被抛出和处理。有效地管理异常不仅可以增强程序的稳定性，还可以提高用户体验，使程序能够优雅地处理错误情况。本章详细讲解了异常的基本概念以及如何捕获和处理异常。

loguru日志模块：简化Python自动化测试的日志管理！

07-29

770

日志是软件开发中的关键组成部分，为开发和测试人员提供了调试和监控应用程序的重要手段。loguru 是一个第三方的 Python 日志库，以其简洁的 API 和自动化的功能脱颖而出。本文将探讨为什么项目中需要日志，loguru 为何受到青睐，以及如何封装和在接口自动化测试项目中使用 loguru，同时结合 Allure 生成丰富的测试报告。

Python面试题：如何使用WebSocket实现实时Web应用

最新发布

bigorsmallorlarge的专栏

07-30

333

通过上述步骤，你可以使用 Django Channels 和 WebSocket 创建一个简单的实时 Web 应用。Django Channels 提供了强大的功能，使得在 Django 中实现实时功能变得更加容易。你可以在此基础上扩展，添加更多功能和复杂的逻辑。

安卓手机部署大模型实战

奇舞周刊

07-25

1176

本文作者系360奇舞团前端开发工程师前言自ChatGPT发布以来，大语言模型（Large language model, LLM)就成了AI乃至整个计算机科学的话题中心。学术界，工业界围绕大语言模型本身及其应用展开了广泛的讨论，大量的新的实践层出不穷。由于LLM对计算资源的需求极大，有能力部署大语言模型的公司和实验室一般通过搭建集群，然后开放API或者网页demo的方式让用户可以使用模型。在人们纷...

Python入门知识点 10--闭包与装饰器

@网工小赵的博客

07-30

716

什么情况下会用到装饰器特性:在不修改源代码的基础上,给函数加功能。

【Python数据增强】图像数据集扩充

阿齐Archie

07-25

2338

该脚本用于图像数据增强，特别是目标检测任务中的图像和标签数据增强。通过应用一系列数据增强技术（如旋转、平移、裁剪、加噪声、改变亮度、cutout、翻转等），生成多样化的图像数据集，以提高目标检测模型的鲁棒性和准确性。

精通Pandas进行金融数据分析

"Mastering Pandas for Finance" "Mastering Pandas"是一本专注于利用Python的Pandas库进行金融数据分析的专业书籍。由Michael Heydt撰写，该书深入浅出地介绍了如何利用Pandas这一强大的开源数据分析库来处理和...