数据分析之python（二）

wusupersuper

已于 2024-02-23 18:26:01 修改

阅读量415

点赞数 9

文章标签：数据分析 python

于 2024-02-23 18:24:30 首次发布

本文链接：https://blog.csdn.net/wusupersuper/article/details/136259155

版权

筛选

data['age']>35
data[data['age']>35]  #筛选出age大于35的数据

去重

data.drop_duplicates(subset='uid',keep='first',inplace='True')  #subset指定去重字段，keep保留重复值的第一个值，inplace默认为False不改变原数据，True为修改原数据

合并

concat_demo = pd.concat([data,data2],axis=0)

连接

pd.merge(concat_demo,user_level,how='inner',on='uid')  #左表和右表，how选择连接方式，on为连接字段
pd.merge(concat_demo,user_level,how='inner',lift_on='uid',right_on='user_id')  #列名不同时的连接

字段重命名

data2.rename(columns={'uid':user_id},inplace=True)

删除字段

data.drop('uid',axis=1)

排序

data.sort_values(['uid','age'],ascending=[True,False])  #True为升序，False为降序

匿名函数

sum = lambda x,y:x+y
sum(2,4)    #6

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wusupersuper

关注关注

9
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python进阶（一）筛选数据

weixin_43748338的博客

12-22

596

如何在列表、字典、集合中根据条件筛选数据列表过滤负数 data = [-1,2,3,-4,5] 普通方式使用for循环if判断进行过滤 res = [] for i in data: if i >= 0: res.append(i) print(res) 高级 1. 列表解析 2. filter函数 ## 列表解析 data = [-1, 2, 3, -4, 5] data = [x for x in data if x >= 0] data ## fi

数据分析之Python-Pandas详解

大河之犬的博客

09-09

1万+

Pandas 是 Python 语言的一个扩展程序库，用于数据分析。Pandas 是一个开放源码、BSD 许可的库，提供高性能、易于使用的数据结构和数据分析工具。Pandas 名字衍生自术语 “panel data”（面板数据）和 “Python data analysis”（Python 数据分析）。Pandas 一个强大的分析结构化数据的工具集，基础是Numpy（提供高性能的矩阵运算）。Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。

1 条评论您还未登录，请先登录后发表或查看评论

Python数据分析之股票分析

qq_40202164的博客

07-20

3617

利用tushare库进行股票的数据分析

【python与数据分析】Python与数据分析概述

m0_72318954的博客

09-11

4552

数据分析的介绍与Python在数据分析方面的应用

Python数据分析与机器学习在医疗诊断中的应用

热门推荐

屿小夏.的知识博客

06-14

3万+

在现代医疗领域，数据分析与机器学习的应用已经成为提升医疗诊断效率和准确性的关键手段。医疗诊断系统通过对大量患者数据进行分析，帮助医生预测疾病风险、制定个性化治疗方案，并且在疾病早期阶段提供预警。Python作为一种灵活且功能强大的编程语言，结合其丰富的数据分析和机器学习库，成为医疗诊断系统开发的首选工具。本文将探讨Python数据分析与机器学习在医疗诊断中的应用，详细介绍构建医疗诊断系统的步骤和技术。

《python金融数据分析》

qq_33790600的博客

01-26

8418

前言 Python 已广泛应用于银行业、投资管理保险业、房地产行业等金融领域用于开发金融模型、管理风险和自动完成交易。许多大型金融机构依赖 Python 来搭建职位管理、资产定价、风险管理和交易系统等基础设施。本书将介绍核心的金融理论，并给出它们的数学概念，以帮助读者更好地理解它们在实际中的应用价值。你将了解如何应用 Python 求解经典的资产定价模型，解决金融中的线性和非线性问题，开发数值程序和利率模型，以及如何根据有限差分法定价来描绘含有期权的隐含波动率曲线等。随着高级计算技术的出现，我们必须要

python进行数据分析的各种绘图

weixin_53639312的博客

02-25

3764

箱型图、条形图、直方图、帕累托图、折线图、散点图、饼状图

AI时代Python大数据分析

01-03

3万+

AI时代Python大数据分析

基于Python的数据分析

跑得动就不要歇着

02-25

3万+

下面来介绍一下基于Python的数据分析，主要介绍数据分析的概念、数据分析流程、Python优势、常用模块的用途以及使用 Python进行数据分析的学习方法及步骤；随着大数据和人工智能时代的到来，网络和信息技术开始渗透到人类日常生活的方方面面，产生的数据量也呈现指数级增长的态势，同时现有数据的量级已经远远超过了目前人力所能处理的范畴。在此背景下，数据分析成为数据科学领域中一个全新的研究课题。...

基于Python的大数据分析实战篇（二）

好好读书

06-12

6545

基于Python的大数据分析实战篇，实战练习数据分析，简单快捷

利用python进行数据分析第二版最新版

05-19

内容概要：利用python进行数据分析第二版最新版适合人群：应届毕业生，工作1-3年的研发人员阅读建议：基于python，英文版

python数据分析课程设计

03-17

Python数据分析课程设计是一个深入探索和理解数据的实践过程，它涵盖了数据预处理、探索性数据分析、建模以及结果解释等多个环节。在这个课程设计中，学生通常会接触到一系列Python库，如Pandas、NumPy、Matplotlib...

数据分析大作业（期末大作业） python juypter notebook

12-12

数据集来自Kaggle网站上公开的Hotel ...本次数据分析主要包含如下内容：总览数据，完成对数据的数据预处理利用数据集对酒店运营状况/市场情况/客户画像进行数据分析 根据数据集建立预测模型，预测客户是否会取消预订.

【项目实战】Python实现基于LDA主题模型进行电商产品评论数据情感分析

02-14

Python作为流行的编程语言，其强大的数据分析和处理能力使得它成为此类任务的理想选择。二、分析流程 1. 数据收集：首先，我们需要获取电商产品评论数据，这通常来自公开的API接口或爬虫技术。 2. 数据预处理：...

数据分析-28-交互式数据分析EDA工具和低代码数据科学工具

qq_20466211的博客

10-01

372

python中的低代码数据分析工具，支持EDA数据探索的工具，如Dataprep，Dtable

LLM 构建Data Multi-Agents 赋能数据分析平台的实践之⑥：NL2SQL技术探讨

weixin_43990004的博客

09-30

1076

NL2SQL（Natural Language to SQL）是一种将自然语言转换为结构化查询语言的技术。它可以帮助用户通过使用自然语言来与数据库进行交互，而无需了解复杂的SQL语法。NL2SQL技术的背景：随着人工智能的发展，越来越多的人开始尝试使用自然语言处理技术来解决实际问题。其中，NL2SQL就是一种非常重要的应用领域。它的目标是让用户能够通过简单的自然语言指令来访问和操作数据库中的数据，从而提高工作效率和用户体验。NL2SQL技术的难点：实现NL2SQL需要解决许多挑战性的问题。

数据分析-27-基于pandas进行模糊匹配merge_asof和groupby分组统计

qq_20466211的博客

10-01

342

pandas.merge_asof()函数是pandas库中的一个非常实用的函数，用于根据时间戳将两个数据集进行合并。该函数可以很好地处理时间戳不完全匹配的情况，并进行模糊匹配。理解groupby：split(分割)、apply(应用)、combine(组合)。(1)split：按照指定的key分割dataframe；(2)apply：对每个组应用聚合函数；(3)combine：将所有的聚合结果合并成一个数据框。

计算机毕业设计基于Hadoop的智慧校园数据共享平台的设计与实现 Python 数据分析 可视化大屏附源码文档

weixin_19164791635

09-26

2146

本文介绍了一款基于Hadoop的智慧校园数据共享平台，该平台利用大数据技术实现校园数据的集中存储、处理和共享。平台服务于管理员和用户，提供教学资源、设施信息、实验数据等服务，旨在提高校园数据管理效率，促进教育信息化，为教育决策提供数据支持。

数据可视化基础：让数据说话