pandas
此去经年天问
这个作者很懒,什么都没留下…
展开
-
pyton pip3下载速度慢
pip 或 pip3更换源为国内源方案二:临时给pip 或 pip3换源命令格式:sudo pip3 install 包名 -i 镜像源url如下图:pip 或 pip3更换源为国内源比如我在用pip3安装Python模块matplotlib的时候,下载速度只有是几ksudo pip3 install matplotlib -i https://pypi.douban.com/simple/ sudo pip3 install matplotlib -i https://pypi.douban转载 2020-10-04 16:55:14 · 158 阅读 · 0 评论 -
[转载]python – Pandas使用groupby中的count来创建新列
一个看起来如下的df:我正在尝试创建一个看起来像这样的df:我努力了df["count"] = df.groupby("item")["color"].transform('count')但它并不是我所寻找的.任何指导表示赞赏这不是一个新专栏,这是一个新的DataFrame:要获得所需的结果,请使用reset_index:要获得“新列”,您可以使用transform:...转载 2020-09-16 14:27:05 · 4025 阅读 · 1 评论 -
dataframe寻找两个dataframe某一列相同的差集
问题提出:有以下两个数据集,df_data、df_FAIL,其中df_data的SN和df_FAIL的SerialNumber的特征是相同的,现在要找出特征在SerialNumber但是不在SN中的集合。df_data:df_FAIL:1. 首先寻找交集dataframe筛选数据根据某一个列的数据在另外的一个dataframe的列中:参考链接#找到交集df_FAIL_IN = df_FAIL[df_FAIL["SerialNumber"].isin(df_data["SN"])]2.原创 2020-09-16 09:30:25 · 5362 阅读 · 1 评论 -
[转载]Pandas越过前几行,将后面某行设为标题
Python Pandas:我无法将第二行设置为列标题原来数据集前几行并不是标题,因此需要去除,解决方法如下:#skiprows参数为需要跳过的行数df_C78C3 = pd.DataFrame(pd.read_excel(excelFile3,skiprows=3))或指定标题的行索引:df_C78C3 = pd.DataFrame(pd.read_excel(excelFile3,header = 3))...转载 2020-09-14 11:16:39 · 3320 阅读 · 0 评论 -
python绘制散点图
参考:plt.scatter 分类数据 legend 添加图例plt.figure(figsize=(10, 10))colors = ['b','r']s = [0,1]marker1 = ["^", "o"]for index in range(2): XOffset = df_SPI2.loc[df_SPI2['Result'] == index]['XOffset'] YOffset = df_SPI2.loc[df_SPI2['Result'] == index]['Y原创 2020-09-10 16:18:20 · 3480 阅读 · 0 评论 -
Pandas在某列前加字符串
df_SPI数据类型为int64类型,首先需将其转为字符串#'Date'所在列数据转为字符串df_SPI['Date'] = df_SPI['Date'].astype('str')#取得‘Date’中字符串大小为7的行的indexindex4 = df_SPI.index[df_SPI["Date"].str.len() == 7]#将‘Date’列中符合条件的index所在行前面加上字符串'0'df_SPI.loc[index4,["Date"]] = '0' + df_SPI.loc[in原创 2020-09-09 15:27:19 · 4669 阅读 · 0 评论 -
[转载]pandas切片索引中loc、iloc、ix的区别
在用pandas进行DataFrame的处理时,经常需要对某行或某列进行索引,在不同的书中,会用到不同的索引方法。其中,最常见的就是loc,iloc,ix三种方法。①loc——通过行标签进行索引②iloc——通过行号进行索引③ix——结合前两种的混合索引举例说明:import pandas as pddf =...转载 2019-12-22 19:01:54 · 445 阅读 · 0 评论 -
如何删除pandas中产生的Unnamed:0列
原文链接解决方案一:pd.read_csv(path, index_col=0)或pd.to_csv(path, index=False)解决方案二:用pandas处理数据是,产生了 Unnamed:0 列,解决方案如下:df.loc[ : , ~df.columns.str.contains("^Unnamed")]如果不对的话就换成df.loc[ : , ~df.col...转载 2019-11-28 19:04:08 · 7827 阅读 · 1 评论