Pandas的数据处理

Task1 Pandas基础操作


In [1]:

#导包
import pandas as pd
import numpy as np

1. 创建DataFrame

In [2]:

data = {"grammer":['Python', 'C', 'Java', 'R', 'SQL', 'PHP', 'Python', 'Java', 'C', 'Python'],
       "score":[6, 2, 6, 4, 2, 5, 8, 10, 3, 4], 
       "cycle":[4, 2, 6, 2, 1, 2, 2, 3, 3, 6]}
df = pd.DataFrame(data)
df

Out[2]:

grammerscorecycle
0Python64
1C22
2Java66
3R42
4SQL21
5PHP52
6Python82
7Java103
8C33
9Python46

2. 查看前5行数据

In [3]:

df.head() # 默认为5

Out[3]:

grammerscorecycle
0Python64
1C22
2Java66
3R42
4SQL21

3. 查看后5行数据

  • 注:这里只给出一种方法,小作业需要在想一种方法哦!

In [55]:

# 法一:
df.tail(5) # 不填的话默认为5

Out[55]:

grammerscorecyclelen_str
5PHP523
6Python826
7Java1034
8C331
9Python466

4. 查看所有列名

In [40]:

df.columns

Out[40]:

Index(['grammer', 'score', 'cycle'], dtype='object')

5. 查看数据框行列数

In [41]:

df.shape

Out[41]:

(10, 3)

6. 查看行数

In [42]:

# 方法一:
df.shape[0]
# 方法二:
len(df)

Out[42]:

10

7. 查看列数

  • 注:这里只给出一种方法,小作业需要在想两种方法哦!

In [56]:

#方法一:
df.shape[1]

Out[56]:

4

8. 查看索引、数据类型和内存信息

In [44]:

df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10 entries, 0 to 9
Data columns (total 3 columns):
 #   Column   Non-Null Count  Dtype 
---  ------   --------------  ----- 
 0   grammer  10 non-null     object
 1   score    10 non-null     int64 
 2   cycle    10 non-null     int64 
dtypes: int64(2), object(1)
memory usage: 368.0+ bytes

9. 查看索引

In [45]:

df.index

Out[45]:

RangeIndex(start=0, stop=10, step=1)

10. 查看数值型列的汇总统计

In [46]:

df.describe()

Out[46]:

scorecycle
count10.00000010.00000
mean5.0000003.10000
std2.5819891.72884
min2.0000001.00000
25%3.2500002.00000
50%4.5000002.50000
75%6.0000003.75000
max10.0000006.00000

11. 查看每列的数据类型

In [47]:

df.dtypes

Out[47]:

grammer    object
score       int64
cycle       int64
dtype: object

12. 查看某列共有几种元素

In [48]:

#方法一:
len(df['grammer'].unique())

Out[48]:

6

13. 查看Pandas与Numpy版本

In [49]:

np.__version__
pd.__version__

Out[49]:

'1.1.3'

14. 查看某一列各元素出现的次数

In [50]:

df['grammer'].value_counts()

Out[50]:

Python    3
C         2
Java      2
PHP       1
R         1
SQL       1
Name: grammer, dtype: int64

15. 查看某列每个字符串的长度

In [51]:

# 方法一:
df['grammer'].str.len()

Out[51]:

0    6
1    1
2    4
3    1
4    3
5    3
6    6
7    4
8    1
9    6
Name: grammer, dtype: int64

In [53]:

# 方法二:
df['grammer'].map(lambda x: len(x))

Out[53]:

0    6
1    1
2    4
3    1
4    3
5    3
6    6
7    4
8    1
9    6
Name: grammer, dtype: int64

In [ ]:

 
 

小作业

16.查看最后5行数据

  • 想想其他方法,不能使用tail()函数!

In [ ]:

 
 

17. 查看列数

  • 在想想其他方法可以查看列数的,df.shape[1]上面已经给出了哈!

In [ ]:

 
 

18. 查看某列共有几种元素

  • 上面给出了一种方法:len(df['grammer'].unique()),小伙伴再想想其他方法哈!

In [ ]:

  • 30
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暴躁的秋秋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值