Pandas 基本使用

1  读取txt 文件

df_train=pd.read_table("totalExposureLog_count1_static_uniq_average_process.txt")

2 读取csv 文件

df_test = pd.read_csv('./submission.csv')

3 得到数据的 描述

print(df_test1.describe())

当没有出现正常的时候,要把每一列的值转为float
4 两个id 相同的表合并

result = pd.merge(df_test, df_test1, how='right', on=['id', 'id'])

5 得到表的行列数

print(result.shape)

6 查看pandas 数据的类型:print(df_test.info()) 

<class 'pandas.core.frame.DataFrame'>
Int64Index: 38596 entries, 0 to 38595
Data columns (total 2 columns):
id        38596 non-null int64
target    38596 non-null float64
dtypes: float64(1), int64(1)
memory usage: 904.6 KB

7 转换 pandas 数据的类型

df_test=pd.DataFrame(df_test,dtype=np.float)
df_test[["id"]]=pd.DataFrame(df_test[["id"]],dtype=np.int)

8  求某两列均值

result['target_all'] = np.mean(result[["target_x","target_y"]].values, axis=1)

9 新建个pandas 

sub_df = pd.DataFrame({'id':result['id'].values,'id1':result['id1'].values})
sub_df["target"] = result['target_all']
sub_df.to_csv("lgb_submission_stack.csv", index=False)

10  pandas 查看是否有na

df.isnull()

print(df.isnull().any()) #用来判断某列是否有缺失值

11 切分数据:split -l 50 wlan_date.txt wlan
拆分后会生成 wlanaa wlanab wlanac 三个文件,wlanaa wlanab两个文件分别50行,wlanac文件剩下20行

12 修改列名:df_test.rename(columns={'出价':'操作后新的出价值', '行业id':'广告行业id','账户id':'广告账户id',}, inplace = True)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pandas是一个强大的数据处理和分析工具,它提供了丰富的功能和方法来处理和操作数据。以下是一些Pandas基本方法: 1. 创建DataFrame:可以使用Pandas的DataFrame对象来创建和操作数据表。可以通过传入字典、列表、数组等不同的数据结构来创建DataFrame。 2. 读取和写入数据:Pandas可以读取和写入各种格式的数据,如CSV、Excel、SQL数据库等。可以使用`read_csv()`、`read_excel()`等方法读取数据,使用`to_csv()`、`to_excel()`等方法写入数据。 3. 数据查看和统计:可以使用`head()`方法查看DataFrame的前几行数据,默认为前5行;使用`tail()`方法查看DataFrame的后几行数据,默认为后5行。还可以使用`describe()`方法获取DataFrame的统计信息,如均值、标准差、最小值、最大值等。 4. 数据选择和过滤:可以使用`loc[]`和`iloc[]`方法进行数据的选择和过滤。`loc[]`用于基于标签进行选择,`iloc[]`用于基于位置进行选择。可以通过传入行索引和列索引来选择特定的数据。 5. 数据排序:可以使用`sort_values()`方法对DataFrame进行排序。可以指定要排序的列名以及升序或降序排列。 6. 数据聚合和分组:可以使用`groupby()`方法对数据进行分组和聚合操作。可以根据某一列或多列进行分组,并应用聚合函数(如求和、平均值、计数等)。 7. 缺失值处理:可以使用`isnull()`和`fillna()`方法来处理缺失值。`isnull()`方法用于检测缺失值,`fillna()`方法用于填充缺失值。 8. 数据合并和连接:可以使用`merge()`和`concat()`方法将多个DataFrame进行合并和连接。`merge()`方法可以根据指定的列将两个DataFrame进行合并,`concat()`方法可以将多个DataFrame按行或列进行连接。 9. 数据可视化:Pandas提供了简单易用的数据可视化功能,可以使用`plot()`方法绘制各种类型的图表,如折线图、柱状图、散点图等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值