pandas基础
文章平均质量分 51
Preblue
这个作者很懒,什么都没留下…
展开
-
python日期&时间函数详解
now()、timestamp()与timetuple()等方法前加utc则可以转化为UTC标准时区。dt.timestamp() :将datetime转换为时间戳timestamp。dt.strptime() :将时间字符串转换为格式化的datetime。dt.strftime() :将datetime转换为格式化的时间字符串。dt.fromtimestamp() :将时间戳转换为datetime。dt.timetuple() :将datetime转换为时间元组。dt.now() :获取当前日期和时间。原创 2022-03-12 09:56:24 · 6421 阅读 · 0 评论 -
pandas中map,apply和applymap的用法
疑问1,map 和lambda1.吗原创 2021-04-04 20:14:20 · 498 阅读 · 2 评论 -
pandas中格式转换(粗略)
1. df.style.format用法 df.style.format(formatter,subset=None,na_rep: Union[str, NoneType] = None,)常用df.style.foramt("{‘列名’:格式}")例如有这样的一个DataFrame,我们把它转换为float类型,精确到小数点后两位可以键入:df6.style.format("{:0.2f}")结果:如果要改为百分比格式:#精确到小数点后两位df6.style.for原创 2021-03-31 07:19:01 · 2439 阅读 · 0 评论 -
np.concatenate()
原创 2021-02-09 11:21:26 · 185 阅读 · 0 评论 -
创建DataFrame
方法一:非唯一值字典法d1=pd.DataFrame({‘id’:[102,103,101],‘color’:[‘blue’,‘red’,‘yellow’]})d1#当values为多个连续的数值或者随机值的时候可以用到numpy的一些methodimport numpy as npd2=pd.DataFrame({‘id’:np.arange(101,104),‘score’:np.random.randint(80,100,size=3)})d2方法二:二维数组法#生成一个原创 2021-02-06 21:40:11 · 214 阅读 · 0 评论 -
举例说明pandas中的combine_first的作用
1. 创建一个数据表df1import pandas as pdimport numpy as npdf1=pd.DataFrame(np.arange(6).reshape(3,2),index=[‘a’,‘b’,‘c’],columns=[‘one’,‘two’]df1)2.第二个表df2,和df1有两个重复的位置但是数据不同,在图中用红框标注了出来df2=pd.DataFrame(5+np.arange(4).reshape(2,2),index=[‘a’,‘c’],columns原创 2021-01-08 11:08:01 · 667 阅读 · 0 评论 -
pandas认识、查找和处理缺失值(基础篇)
1.认识缺失值pandas中NaN表示缺失值创造缺失值(1):from numpy import nan as NAdat=pd.Series([NA,1,3])创造缺失值(2):原创 2021-01-07 14:50:39 · 8671 阅读 · 0 评论 -
pandas查找某个字段下的基本信息value_counts
以一个music表为例,查找每种性别分别有多少个,占比是多少1.首先查找每个gender=0和=1的数量方法一:以一个music的表格为例,values_count()是series的argumentimport pandas as pdmusic=pd.read_csv('music.csv')music.gender.value_counts()结果如下方法二:用groupby把数据按照gender分类,输出count()不推荐 没有必要这时候用import pandas as p原创 2021-01-05 16:15:01 · 651 阅读 · 0 评论 -
Pandas插入多行数据
1.导入数据import pandas as pdmusic=pd.read_csv('music.csv')music内容如下2.创建新的dataframe,包含要新增的row,并且令列名等于原表(music)的列名,这里新增两个人,一个60岁,一个61岁new_rows=pd.DataFrame([[60,1,'rock'],[61,0,'hiphop']],columns=music.columns)new_rows的结果如下:3.将两个dataframe合并,同时要忽略i原创 2021-01-05 13:49:56 · 5746 阅读 · 0 评论 -
pandas读取表格时候header的用法
1.header=0读取一个music的dataframe,不设置header,则pandas会默认header=0 也就是数据表的第一行为表头import pandas as pdmusic=pd.read_csv('music.csv')#默认查看前5行数据,括号内可以自定义行数music.head()2. header为大于0的整数设置header=2,会把数据表的第二行当作表头,第二行前面的数据会丢失,header等于几,那一行就会被设置为标题行> `music2=pd原创 2021-01-07 10:50:30 · 17576 阅读 · 0 评论