【前言】
这里我会根据建模的一般流程和需要的能力对python的语句进行整理,对每一步能力我会挑出自己认为比较简单的方法进行记录,因为从0-1学习python首先做到能实现目标就可以,不需要掌握多种方法。
【建模流程】
第一步:python导入数据
第二步:数据格式转换,list表转为数据框,字符转为数字
第三步:用python进行计算求解,得到模型值
第四步:用循环方法实现多个列字段的统计,并把结果整合为数据框输出
第一步、数据导入
• excel导入
#导入csv格式文件
data=pd.read_csv(".csv")
#查看前几行案例
data.head(5)
• sql导入
#读取odps表
data=o.get_table("tablename")
#把odps表转换成pandas中的DataFrame格式
data.to_pandas()
• 创数据集
pd.DataFrame({"apple":[12,13,14,15],"banana":[21,22,23,24]},index=["a","b","c","d"])
第二步、数据清洗格式转换
问题:当x是list列表,需要转为数据框时
语句:pd.DataFrame({"r2":x,"num":y},index=z)
解释:r2是列名,x是数据列,z是行名称
问题:把'age'列的字符替换成数字
语句:data['age1']=data['age'].map({