数据处理和分析
小白学习pandas、pyspark的日常
阳光下的小白菜
day day up
展开
-
pandas-udf函数定义和使用
本文介绍pandas下udf函数处理单列/多列数据返回单列多列结果的demoimport pandas as pddef func1(x): y = x + 1 return y def func2(x1,x2): y = x1+x2 return ydef func3(x1,x2): y1 = x1+x2 y2 = x1-x2 return y1,y2df = pd.read_csv("test.csv")# 简单处理df.loc[:,'y1'] =原创 2022-01-22 19:35:39 · 2423 阅读 · 0 评论 -
csv文件的读写-pandas和python csv包两个版本
python有csv可以直接import用于读写csv文件,pandas包也可以直接读取csv文件。import csv 读写csv文件主要使用reader和writer读写文件from tqdm import tqdmfilename = "./test.csv"csvFile = open(filename, "r")reader = csv.reader(csvFile)fileHeader = []csvWriter = open("output.csv", 'w')writer原创 2022-01-22 19:07:09 · 1289 阅读 · 0 评论 -
pandas-各类文件读取(csv, xls, parquet)和基本操作
获取各列信息,修改列列名,常规表merge等基操原创 2022-01-22 18:25:38 · 2556 阅读 · 0 评论