python读取特定两列_在两列python数据框之间的范围内搜索特定值

最新推荐文章于 2024-03-19 17:47:50 发布

weixin_40002846

最新推荐文章于 2024-03-19 17:47:50 发布

阅读量796

点赞数

文章标签： python读取特定两列

As of writing this, the current stable release is v0.21.

df0 = pd.read_csv('file1.csv')

df1 = pd.read_csv('file2.csv')

df0

Car Mileage

0 A 8

1 B 6

2 C 10

df1

Score Mileage(Min) Mileage(Max)

0 1 1 3

1 2 4 6

2 3 7 9

3 4 10 12

4 5 13 15

要查找分数,请通过调用IntervalIndex.from_tuples使用pd.IntervalIndex.这应该非常快-

v = df1.loc[:, 'Mileage(Min)':'Mileage(Max)'].apply(tuple, 1).tolist()

idx = pd.IntervalIndex.from_tuples(v, closed='both') # you can also use `from_arrays`

df0['Score'] = df1.iloc[idx.get_indexer(df0.Mileage.values), 'Score'].values

df0

Car Mileage Score

0 A 8 3

1 B 6 2

2 C 10 4

here概述了其他创建IntervalIndex的方法.

df0.to_csv('file3.csv')

这是我在这里所做的概述.

>首先,读入CSV文件

>使用pd.IntervalIndex构建间隔索引树.因此,搜索现在的复杂度是对数的.

>使用idx.get_indexer查找树中每个值的索引

>使用索引在df1中找到得分值,并将其分配回df0.请注意,我称.values,否则,分配回来时这些值将不对齐.

>将结果写回CSV

请注意,IntervalIndex是v0.20中的新功能,因此,如果您使用的是较旧的版本,请确保使用

pip install --upgrade pandas

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_40002846

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python dataframe 模糊匹配_对dataframe列应用模糊匹配并将结果保存到新列中

weixin_39698217的博客

12-22

2538

我有两个数据帧，每个数据帧有不同的行数。下面是每个数据集的几行df1 =Company City State ZIPFREDDIE LEES AMERICAN GOURMET SAUCE St. Louis MO 63101CITYARCHRIVER 2015 FOUNDATION ...

pandas 中dataframe 中的模糊匹配与pyspark dataframe 中的模糊匹配

apache150的博客

07-24

1万+

1.pandas dataframe 匹配一个很简单,批量匹配如下 df_obj[df_obj['title'].str.contains(r'.*?n.*')] #使用正则表达式进行模糊匹配,*匹配0或无限次,?匹配0或1次 pyspark dataframe 中模糊匹配有两种方式 2.spark dataframe api, filter rlike 联合使用 df1=d...

参与评论您还未登录，请先登录后发表或查看评论

python中在什么区间怎么表示_python numpy元素的区间查找方法

weixin_39706127的博客

11-28

761

找了半天，以为numpy的where函数像matlab 的find函数一样好用，能够返回一个区间内的元素索引位置。结果没有。。（也可能是我没找到）故自己写一个函数，找多维数组下的，在某个开区间的元素位置import numpy as npdef find(arr,min,max):pos_min = arr>minpos_max = arr3,a=min#pos_max = arr=3) & (a...

python 查找两列不同的值、相同的值（dataframe数据探索）

Huangxin_Yu的博客

10-30

1万+

在做数据挖掘时，查看训练集、测试集数据的情况时，有时需要查看两者之间不同的值和相同的值。 import pandas as pd import numpy as np data1 = pd.DataFrame({ 'a':[1,2,3,4,5,6,7,8,9,9] }) data2 = pd.DataFrame({ 'a':[1,12,13,14,15,16,17,18,19,19] }) def same_element(list1,list2): set1 = set(list1

python两字段模糊匹配_2列之间的模糊匹配（Python）

weixin_36408592的博客

12-30

851

I have a pandas dataframe called "df_combo" which contains columns "worker_id", "url_entrance", "company_name". I am trying to produce an output column that would tell me if the URLs in "url_entrance"...

Python数据处理

既然选择远方，便只顾风雨兼程！

01-17

4587

文章目录matplotlib概念绘制折线图设置图片大小保存图片定义坐标轴的疏密总代码案例定义坐标轴的刻度设置字体显示中文添加描述信息改进后绘制网格线案例绘制散点图案例绘制条形图案例绘制直方图案例绘制饼图案例numpy数组基础创建形状降维取值使用轴文件读取数据数组的转置数组高阶索引和切片修改和布尔索引nan和inf统计函数去除nan数组的拼接数据的行列交换其他方法pandasseries创建切片和索引读取数据DataFrame创建连接mongo读取数据处理数据基本用法取行取列loc布尔索引字符串索引数据处理缺

用Python制作空间数据可视化

y1282037271的博客

02-02

525

大数据时代到来，随着智能设备与物联网技术的普及，人在社会生产活动中会产生大量的数据。在我们的日常活动中，手机会记录下我们到访过的地点；在使用城市公交IC卡、共享单车等服务时，服务供应商会知道这些出行需求产生的时间与地点；公交车与出租车的定位信息，也可以告诉我们城市交通状态的具体情况。这些具备时间、空间与个体属性的数据能够为城市交通的智慧管控提供强有力的支持。

python安装pandas太慢_还在抱怨pandas运行速度慢？这几个方法会颠覆你的看法

weixin_39951930的博客

12-04

1919

作者：xiaoyu微信公众号：Python数据科学前言当大家谈到数据分析时，提及最多的语言就是Python和SQL。Python之所以适合数据分析，是因为它有很多第三方强大的库来协助，pandas就是其中之一。pandas的文档中是这样描述的：“快速，灵活，富有表现力的数据结构，旨在使”关系“或”标记“数据的使用既简单又直观。”我们知道pandas的两个主要数据结构：dataframe和serie...

【面向初学者】四个例子带你了解如何《利用Python进行数据分析》

qq_56761424的博客

07-12

396

关于数据分析，我们提供了四个数据集供大家学习，分别是：1.MoviesLens 1M数据集2.美国1880-2010年的婴儿名字3.美国农业部视频数据库4.2012年联邦选举委员会数据库。

python删除csv某一列_python csv 删除列

weixin_39533052的博客

11-29

6227

广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！我的input.csv看起来是这样的： day,month,year,lat,long01,04,2001,45.00,120.0002,04,2003,44.00,118.00 我试图删除“year”栏及其所有条目。总共有40多个条目，从1960年到2010年不等...我有以下标...

Python实现模糊匹配

10-17

Python实现字符串的模糊匹配，‘?’代表一个字符, ‘*’代表任意多个字符。给一段明确字符比如avdjnd 以及模糊字符比如*dj?dji?ejj，判断二者是否匹配。若能匹配输出”Yes”, 否则输出“No”

python 定位/修改DataFrame类型中某一值根据相对时间的先后顺序来寻找参数值

RPG_Zero的博客

09-07

924

需求描述：现在有一条生产线在生产一种产品，生产线上不同生产参数的数值会在许许多多的时间点上被记录，产品被生产出来时会有相对应的生产时间。对于产品A，小于其生产时间、并且离其生产时间最近的各个被记录的生产参数就是产品A所对应的生产参数。提供生产表：parameter.xlsx 其中包含各个时间点、记录的参数名称以及参数值提供产品表：ID_concat.xlsx 其中包含各个产品的生产时间使用ID[y][i] = stove['value'][j]的形式来更改DataFrame类型的某一个具体值，其

合并DataFrame，并在没有精确匹配的情况下进行模糊匹配

热门推荐

GeekLee的博客

07-17

4万+

>>> import pandas as pd >>> import numpy as np >>> from pandas import Series, DataFrame >>> df = DataFrame({'name':['a','a','b','b'],'classes':[1,2,3,4],'price':[11,22,33,44]}) >>> df classes name

3行实现模糊匹配

weixin_30897079的博客

08-16

155

三行实现模糊匹配 def fuzzyfinding(user_input,collection): s = [(len(re.compile('.*?'.join(user_input)).search(i).group()),re.compile('.*?'.join(user_input)).search(i).start(),i ) for i in c...

利用python如何进行数据匹配_如何使用与其他两列匹配的python在数据集中...

weixin_39863371的博客

12-03

745

我认为您需要groupby与mean by mean一起申请：titanic['age'] = titanic.groupby(['survived','embarked'])['age'].apply(lambda x: x.fillna(x.mean()))import seaborn as snstitanic = sns.load_dataset('titanic')#check NaN ...

Python pandas 通过字段部分匹配合并连接两个DataFrame

m0_60105488的博客

05-30

1010

本文主要介绍Python中，使用pandas通过字段的部分匹配，来连接合并两个 DataFrame的方法，以及相关的示例代码。原文地址：Python pandas 通过字段部分匹配合并连接两个DataFrame

python中对dataframe格式的某列进行匹配替换，apply与lambda结合，或整列replace替换

微信公众号（年更选手）：数据闲逛人 | Github开源项目：数分/数挖study路线 https://github.com/jc-dian/python_data_analysis

03-26

4069

前言自己想对dataframe某列进行替换正文前面是有 data.insert(11,'discovery_like_count',-10) data.insert(12,'discovery_collect_count',-10) data.insert(13,'discovery_comment_count',-10) （1）apply与lambda结合 data['discovery_like_count'] = data['discovery_like_count'].apply(lambd

在 DataFrame 多列数据中模糊查找匹配数据

hamagudu的博客

04-30

5695

先了解一个 DataFrame 筛选数据的方式 import pandas as pd # 创建 DataFrame df = pd.DataFrame(data = [[True, False, False, False], [False, True, False, False], [True, True, False, False], [Fal

python读取excel两列数据变为折线图

07-25

你可以使用Python中的pandas和matplotlib库来读取Excel文件中的两列数据并绘制折线图。下面是一个简单的示例代码： ```python import pandas as pd import matplotlib.pyplot as plt # 读取Excel文件 df = pd.read...