房地产数据处理笔记

proc freq data=a;
by year;
tables month;
run;
data a;
input year$ month$ num;
cards;
2007 01 .
2007 02 200
2007 03 300
2007 04 500
2008 01 .
2008 02 300
2008 03 800
2008 04 1030
2009 01 .
2009 02 600
2009 03 800
2009 04 1400
;
run;
proc sql;
create table a1 as
select year,sum(num) as sum_num from a group by year;quit;
  
data a;set a;if num=. then num=0; month_num=dif(num);run;


proc freq data=a;
by year;
tables month;
run;


proc freq data=a;
weight num;
tables month/out=a1;
by year;
run;
data a2;
set a1;
crement=(COUNT-lag3(COUNT))/COUNT;
run;
data a3;
set a2;
count1=count-lag(count);
run;
data a1;set hose.bq1;run;
data a1;set a1;if _n_<3  then delete;run;
data a1;set a1;len=length(_col0);run;
data a1;set a1;year=substr(_col0,1,4);run;
proc sort data=a1;by year len _col0;run;
data a1;set a1;increment=(F2-lag12(F2))/lag12(F2);run;
data a1;set a1;drop year len;run;
data a1;set a1;increment=100*increment;run;




data a2;set hose.bq2;run;
data a2;set a2;if _n_<3  then delete;run;
data a2;set a2;len=length(_col0);run;
data a2;set a2;year=substr(_col0,1,4);run;
proc sort data=a2;by year len _col0;run;
data a2;set a2;increment=(F2-lag12(F2))/lag12(F2);run;
data a2;set a2;drop year len;run;
data a2;set a2;increment=100*increment;run;




data a3;set hose.bq3;run;
data a3;set a3;if _n_<3  then delete;run;
data a3;set a3;len=length(_col0);run;
data a3;set a3;year=substr(_col0,1,4);run;
proc sort data=a3;by year len _col0;run;
data a3;set a3;increment=(F2-lag12(F2))/lag12(F2);run;
data a3;set a3;drop year len;run;
data a3;set a3;increment=100*increment;run;




data a4;set hose.bq4;run;
data a4;set a4;if _n_<3  then delete;run;
data a4;set a4;len=length(_col0);run;
data a4;set a4;year=substr(_col0,1,4);run;
proc sort data=a4;by year len _col0;run;
data a4;set a4;increment=(F2-lag12(F2))/lag12(F2);run;
data a4;set a4;drop year len;run;
data a4;set a4;increment=100*increment;run;


/*由累计销售额,求单月*/
data a1;set house.bq1;run;
data a1;set a1;if _n_<3  then delete;run;
data a1;set a1;len=length(_col0);run;
data a1;set a1;year=substr(_col0,1,4);run;
proc sort data=a1;by year len _col0;run;
data a1;set a1;if F2=. then F2=0;num=dif(F2);run;
data a1;set a1;if num<0 then num=.;run;
data a1;set a1;increment=(num-lag12(num))/lag12(num);run;
data a1;set a1;drop year len;run;
data a1;set a1;increment=100*increment;run;




data a2;set house.bq2;run;
data a2;set a2;if _n_<3  then delete;run;
data a2;set a2;len=length(_col0);run;
data a2;set a2;year=substr(_col0,1,4);run;
proc sort data=a2;by year len _col0;run;
data a2;set a2;if F2=. then F2=0;num=dif(F2);run;
data a2;set a2;if num<0 then num=.;run;
data a2;set a2;increment=(num-lag12(num))/lag12(num);run;
data a2;set a2;drop year len;run;
data a2;set a2;increment=100*increment;run;




data a3;set house.bq3;run;
data a3;set a3;if _n_<3  then delete;run;
data a3;set a3;len=length(_col0);run;
data a3;set a3;year=substr(_col0,1,4);run;
proc sort data=a3;by year len _col0;run;
data a3;set a3;if F2=. then F2=0;num=dif(F2);run;
data a3;set a3;if num<0 then num=.;run;
data a3;set a3;increment=(num-lag12(num))/lag12(num);run;
data a3;set a3;drop year len;run;
data a3;set a3;increment=100*increment;run;




data a4;set house.bq4;run;
data a4;set a4;if _n_<3  then delete;run;
data a4;set a4;len=length(_col0);run;
data a4;set a4;year=substr(_col0,1,4);run;
proc sort data=a4;by year len _col0;run;
data a4;set a4;if F2=. then F2=0;num=dif(F2);run;
data a4;set a4;if num<0 then num=.;run;
data a4;set a4;increment=(num-lag12(num))/lag12(num);run;
data a4;set a4;drop year len;run;
data a4;set a4;increment=100*increment;run;


data avg_b;set house.avg_b;avg_price=round(_col3*10000/_col2);format _col0 yymmd7.;run;
data avg_b;set avg_b;increment=(avg_price-lag12(avg_price))*100/lag12(avg_price);run;


data avg_l;set house.avg_l;avg_price=round(_col3*10000/_col2);format _col0 yymmd7.;run;
data avg_l;set avg_l;increment=(avg_price-lag12(avg_price))*100/lag12(avg_price);run;
/*累计开发投资同比增长*/
/*单月*/
data invest;set house.invest(keep=_col0 F2 F6);if _n_<3 then delete;len=length(_col0);
            year=substr(_col0,1,4);
proc sort data=invest;by year len _col0;run;
data invest;set invest(drop=year len);
if F2=. then F2=0;if F6=. then F6=0;
            num1=dif(F2);num2=dif(F6);
            if num1<0 then num1=.;
            if num2<0 then num2=.;
            increment1=100*(num1-lag12(num1))/lag12(num1);
            increment2=100*(num2-lag12(num2))/lag12(num2);     
run;
/*累计*/
data sum_invest;set invest;
increment1=100*(F2-lag12(F2))/lag12(F2);
increment2=100*(F6-lag12(F6))/lag12(F6);
run;
/*施工面积同比增长*/


/*累计*/
data building_area;set house.building_area;
     if _n_<3 then delete;year=substr(_col0,1,4);len=length(_col0);
proc sort data=building_area;by year len _col0;run;
data building_area;set building_area(drop=year len);
     incre1=100*(F2-lag12(F2))/lag12(F2);
     incre2=100*(F4-lag12(F4))/lag12(F4);
     incre3=100*(F6-lag12(F6))/lag12(F6);
run;


data buildingl_area;set house.buildingl_area;
 if _n_<3 then delete;year=substr(_col0,1,4);len=length(_col0);
proc sort data=buildingl_area;by year len _col0;run;
data buildingl_area;set buildingl_area(drop=year len);
     incre1=100*(F2-lag12(F2))/lag12(F2);
     incre2=100*(F4-lag12(F4))/lag12(F4);
     incre3=100*(F6-lag12(F6))/lag12(F6);
run;
/*单月*/
data building_month_area;set house.building_area;
     if _n_<3 then delete;year=substr(_col0,1,4);len=length(_col0);
proc sort data=building_month_area;by year len _col0;run;
data building_month_area;set building_month_area;
     if F2=. then F2=0;if F4=. then F4=0;if F6=. then F6=0;
     num1=dif(F2);num2=dif(F4);num3=dif(F6);
     if num1<0 then num1=.;if num2<0 then num2=.;if num3<0 then num3=.;
     incre1=100*(num1-lag12(num1))/lag12(num1);
     incre2=100*(num2-lag12(num2))/lag12(num2);
     incre3=100*(num3-lag12(num3))/lag12(num3);
run;


data buildingl_month_area;set house.buildingl_area;
     if _n_<3 then delete;year=substr(_col0,1,4);len=length(_col0);
proc sort data=buildingl_month_area;by year len _col0;run;
data buildingl_month_area;set buildingl_month_area;
    if F2=. then F2=0;if F4=. then F4=0;if F6=. then F6=0;
     num1=dif(F2);num2=dif(F4);num3=dif(F6);
     if num1<0 then num1=.;if num2<0 then num2=.;if num3<0 then num3=.;
     incre1=100*(num1-lag12(num1))/lag12(num1);
     incre2=100*(num2-lag12(num2))/lag12(num2);
     incre3=100*(num3-lag12(num3))/lag12(num3);
run;






/*投资占比统计,2009-2014年数据,2015月数据*/
data invest_amount;set house.invest_amount;
   if _n_<3 then delete;year=substr(_col0,1,4);len=length(_col0);
proc sort data=invest_amount;by year len _col0;run;
data invest_amount1;set invest_amount;by year len _col0;
    if year=2015 then output;
    else if last.year then output;
run;
data invest1;set invest_amount1;
    incre1=100*F8/F2;incre2=100*F10/F2;incre3=100*F12/F2;incre4=100*F14/F2;
    incre5=100*F16/F2;incre6=100*F18/F2;
run;


data invest_amount;set invest_amount;
     num=dif(F2);num1=dif(F8);num2=dif(F10);num3=dif(F12);num4=dif(F14);
     run;
/*日期格式处理*/
proc import datafile='D:\铭城\房地产案例\—房地产相关数据\2012年至今单月房地产和住宅开发投资及其同比增速.csv' out=a1 replace;run;
data a1;set a1;date1=compress(VAR1,'年');date1=compress(date1,'月');
    len=length(date1);
    year=substr(date1,1,4);
    month=substr(date1,5,7);
    if len=5 then month=cat(0,month);
    date=cats(year,month);
    var1=date;
    drop len year month date1 date;
run;
proc import datafile='D:\铭城\房地产案例\—房地产相关数据\2012年至今累计房地产和住宅开发投资及其同比增速.csv' out=a2 replace;run;
proc import datafile='D:\铭城\房地产案例\—房地产相关数据\2012年至今全国房屋单月新开工和施工面积及其同比增速.csv' out=a3 replace;run;
proc import datafile='D:\铭城\房地产案例\—房地产相关数据\2012年至今全国房屋累计新开工和施工面积及其同比增速.csv' out=a4 replace;run;
proc import datafile='D:\铭城\房地产案例\—房地产相关数据\2012年至今全国商品房和住宅单月销售面积以及销售额同比增速.csv' out=a5 replace;run;
proc import datafile='D:\铭城\房地产案例\—房地产相关数据\2012年至今全国商品房和住宅累计面积以及销售额同比增速.csv' out=a6 replace;run;
proc import datafile='D:\铭城\房地产案例\—房地产相关数据\2012年至今全国商品房和住宅销售均价及同比增速.csv' out=a7 replace;run;
data a2;set a2;date1=compress(VAR1,'年');date1=compress(date1,'月');
    len=length(date1);
    year=substr(date1,1,4);
    month=substr(date1,5,7);
    if len=5 then month=cat(0,month);
    date=cats(year,month);
    var1=date;
    drop len year month date1 date;
run;
data a3;set a3;date1=compress(VAR1,'年');date1=compress(date1,'月');
    len=length(date1);
    year=substr(date1,1,4);
    month=substr(date1,5,7);
    if len=5 then month=cat(0,month);
    date=cats(year,month);
    var1=date;
    drop len year month date1 date;
run;
data a4;set a4;date1=compress(VAR1,'年');date1=compress(date1,'月');
    len=length(date1);
    year=substr(date1,1,4);
    month=substr(date1,5,7);
    if len=5 then month=cat(0,month);
    date=cats(year,month);
    var1=date;
    drop len year month date1 date;
run;
data a5;set a5;date1=compress(VAR1,'年');date1=compress(date1,'月');
    len=length(date1);
    year=substr(date1,1,4);
    month=substr(date1,5,7);
    if len=5 then month=cat(0,month);
    date=cats(year,month);
    var1=date;
    drop len year month date1 date;
run;
data a6;set a6;date1=compress(VAR1,'年');date1=compress(date1,'月');
    len=length(date1);
    year=substr(date1,1,4);
    month=substr(date1,5,7);
    if len=5 then month=cat(0,month);
    date=cats(year,month);
    var1=date;
    drop len year month date1 date;
run;
data a7;set a7;date1=compress(VAR1,'年');date1=compress(date1,'月');
    len=length(date1);
    year=substr(date1,1,4);
    month=substr(date1,5,7);
    if len=5 then month=cat(0,month);
    date=cats(year,month);
    var1=date;
    drop len year month date1 date;
run;
/*继续改格式*/
/*日期格式处理*/
proc import 
datafile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今单月房地产和住宅开发投资及其同比增速 (2).csv' 
out=a1 replace;run;
data a1;set a1;var1=put(var1,6.);run;
proc export data=a1 outfile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今单月房地产和住宅开发投资及其同比增速 (3).csv';
run;




proc import 
datafile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今累计房地产和住宅开发投资及其同比增速 (2).csv' 
out=a2 replace;run;
data a2;set a2;var1=put(var1,6.);run;
proc export data=a2 outfile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今累计房地产和住宅开发投资及其同比增速 (3).csv';
run;


proc import 
datafile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国房屋单月新开工和施工面积及其同比增速 (2).csv' 
out=a3 replace;run;
data a3;set a3;var1=put(var1,6.);run;
proc export data=a3 outfile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国房屋单月新开工和施工面积及其同比增速 (3).csv';
run;


proc import 
datafile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国房屋累计新开工和施工面积及其同比增速 (2).csv' 
out=a4 replace;run;
data a4;set a4;var1=put(var1,6.);run;
proc export data=a4 outfile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国房屋累计新开工和施工面积及其同比增速 (3).csv';
run;




proc import 
datafile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国商品房和住宅单月销售面积以及销售额同比增速 (2).csv' 
out=a5 replace;run;
data a5;set a5;var1=put(var1,6.);run;
proc export data=a5 outfile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国商品房和住宅单月销售面积以及销售额同比增速 (3).csv';
run;


proc import 
datafile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国商品房和住宅累计面积以及销售额同比增速 (2).csv' 
out=a6 replace;run;
data a6;set a6;var1=put(var1,6.);run;
proc export data=a6 outfile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国商品房和住宅累计面积以及销售额同比增速 (3).csv';
run;


proc import 
datafile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国商品房和住宅销售均价及同比增速 (2).csv' 
out=a7 replace;run;
data a7;set a7;var1=put(var1,6.);run;
proc export data=a7 outfile='D:\铭城\房地产案例\—房地产相关数据\房地产相关数据-改日期格式\2012年至今全国商品房和住宅销售均价及同比增速 (3).csv';
run;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值