自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 SQL中的窗口函数

SQL窗口函数

2022-10-07 10:07:11 626 1

原创 python日期&时间函数详解

now()、timestamp()与timetuple()等方法前加utc则可以转化为UTC标准时区。dt.timestamp() :将datetime转换为时间戳timestamp。dt.strptime() :将时间字符串转换为格式化的datetime。dt.strftime() :将datetime转换为格式化的时间字符串。dt.fromtimestamp() :将时间戳转换为datetime。dt.timetuple() :将datetime转换为时间元组。dt.now() :获取当前日期和时间。

2022-03-12 09:56:24 6419

原创 pandas中map,apply和applymap的用法

疑问1,map 和lambda1.吗

2021-04-04 20:14:20 498 2

原创 pandas中格式转换(粗略)

1. df.style.format用法 df.style.format(formatter,subset=None,na_rep: Union[str, NoneType] = None,)常用df.style.foramt("{‘列名’:格式}")例如有这样的一个DataFrame,我们把它转换为float类型,精确到小数点后两位可以键入:df6.style.format("{:0.2f}")结果:如果要改为百分比格式:#精确到小数点后两位df6.style.for

2021-03-31 07:19:01 2439

原创 np.concatenate()

2021-02-09 11:21:26 185

原创 创建DataFrame

方法一:非唯一值字典法d1=pd.DataFrame({‘id’:[102,103,101],‘color’:[‘blue’,‘red’,‘yellow’]})d1#当values为多个连续的数值或者随机值的时候可以用到numpy的一些methodimport numpy as npd2=pd.DataFrame({‘id’:np.arange(101,104),‘score’:np.random.randint(80,100,size=3)})d2方法二:二维数组法#生成一个

2021-02-06 21:40:11 214

原创 SQL面试题(口头回答 非笔试)

1.SQL:where和having的区别。1、where是对原始数据的条件约束,约束的是原始表格的字段。2、having是对分组后数据的筛选,having 前面多和group by l连用,后面跟聚合函数2.join 的几种区别inner join/join级联查询两个表时,返回的结果是两个表中均存的记录left join级联查询两个表时,会返回的左表的所有记录 以及右表存在的记录,没有则返回nullright join级联查询两个表时,会返回的右表的所有记录以及左表存在的记录,没有则返回nu

2021-01-25 10:53:22 407 1

原创 举例说明pandas中的combine_first的作用

1. 创建一个数据表df1import pandas as pdimport numpy as npdf1=pd.DataFrame(np.arange(6).reshape(3,2),index=[‘a’,‘b’,‘c’],columns=[‘one’,‘two’]df1)2.第二个表df2,和df1有两个重复的位置但是数据不同,在图中用红框标注了出来df2=pd.DataFrame(5+np.arange(4).reshape(2,2),index=[‘a’,‘c’],columns

2021-01-08 11:08:01 666

原创 pandas认识、查找和处理缺失值(基础篇)

1.认识缺失值pandas中NaN表示缺失值创造缺失值(1):from numpy import nan as NAdat=pd.Series([NA,1,3])创造缺失值(2):

2021-01-07 14:50:39 8664

原创 pandas读取表格时候header的用法

1.header=0读取一个music的dataframe,不设置header,则pandas会默认header=0 也就是数据表的第一行为表头import pandas as pdmusic=pd.read_csv('music.csv')#默认查看前5行数据,括号内可以自定义行数music.head()2. header为大于0的整数设置header=2,会把数据表的第二行当作表头,第二行前面的数据会丢失,header等于几,那一行就会被设置为标题行> `music2=pd

2021-01-07 10:50:30 17572

原创 pandas查找某个字段下的基本信息value_counts

以一个music表为例,查找每种性别分别有多少个,占比是多少1.首先查找每个gender=0和=1的数量方法一:以一个music的表格为例,values_count()是series的argumentimport pandas as pdmusic=pd.read_csv('music.csv')music.gender.value_counts()结果如下方法二:用groupby把数据按照gender分类,输出count()不推荐 没有必要这时候用import pandas as p

2021-01-05 16:15:01 651

原创 Pandas插入多行数据

1.导入数据import pandas as pdmusic=pd.read_csv('music.csv')music内容如下2.创建新的dataframe,包含要新增的row,并且令列名等于原表(music)的列名,这里新增两个人,一个60岁,一个61岁new_rows=pd.DataFrame([[60,1,'rock'],[61,0,'hiphop']],columns=music.columns)new_rows的结果如下:3.将两个dataframe合并,同时要忽略i

2021-01-05 13:49:56 5746

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除