![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
乱写乱画
一个用来记录笔记的博客
展开
-
pandas数据处理--将txt中的数据进行去重统计数量
import pandas as pdimport numpy as npfrom openpyxl import load_workbookimport osimport reclass doWork: def __init__(self): self.txt_file_dir = "txt_file" self.excel_name1 = r"template.xlsx" # 模板文件 self.excel_name2 = r"sta.原创 2020-08-10 19:07:44 · 1185 阅读 · 0 评论 -
pandas 写入不同sheel
writer=pd.ExcelWriter('tarkov_market.xlsx') self.last_1_Y.to_excel(writer,sheet_name='last_1_M',index=0)#index=0:无索引 self.last_6_M.to_excel(writer,sheet_name='last_7_day',index=0) self.last_1_M.to_excel(writer,sheet_name='last_1_Y'.原创 2020-08-10 11:04:54 · 174 阅读 · 0 评论 -
pandas 将两数据表进行拼接
将两文本内容以下图为例合并,空值补0:import pandas as pddef go(path1, path2, new_file_name): df1 = pd.read_csv(path1, encoding="utf-8") df2 = pd.read_csv(path2, encoding="utf-8") columns = df1.columns df_obj = pd.concat([df1,df2], sort=False) ..原创 2020-07-24 15:55:33 · 523 阅读 · 0 评论 -
初识数据分析之pandas笔记五 索引、选取和过滤
来源:《利用Python进行数据分析·第2版》In [133]: obj = pd.Series(np.arange(4.), index=['a', 'b', 'c', 'd'])In [134]: objOut[134]:a 0.0b 1.0c 2.0d 3.0dtype: float64In [135]: obj['b']Out[135]:...翻译 2019-12-20 17:45:40 · 156 阅读 · 0 评论 -
初识数据分析之pandas笔记四 丢弃指定轴上的项
来源:《利用Python进行数据分析·第2版》丢弃某条轴上的一个或多个项很简单,只要有一个索引数组或列表即可。由于需要执行一些数据整理和集合逻辑,所以drop方法返回的是一个在指定轴上删除了指定值的新对象:In [117]: objOut[117]:a 0.0b 1.0c 2.0d 3.0e 4.0dtype: float64In [118...翻译 2019-12-20 17:28:14 · 144 阅读 · 0 评论 -
初识数据分析之pandas笔记三 索引
来源:《利用Python进行数据分析·第2版》pandas的索引对象负责管理轴标签和其他元数据(比如轴名称等)。构建Series或DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index:In [79]: obj = pd.Series(range(3), index=['a', 'b', 'c'])In [81]: index = obj.indexIn...翻译 2019-12-20 17:06:43 · 153 阅读 · 0 评论 -
初识数据分析之pandas笔记二 DataFrame数据结构
来源:《利用Python进行数据分析·第2版》DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。有关DataFrame内部的技术细节远远超出了本书...翻译 2019-12-20 15:50:03 · 477 阅读 · 0 评论 -
初识数据分析之pandas笔记一 Series数据结构
来源:《利用Python进行数据分析·第2版》Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据即可产生最简单的Series:In [1]: import pandas as pdIn [2]: obj = pd.Series([4, 7, -5, 3])In [3]: objOut[3]:0 ...翻译 2018-07-10 18:05:01 · 426 阅读 · 0 评论