机器学习 增幅预测

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
复制代码
data1 = pd.read_csv('lianjia1.csv', encoding='gbk')
data2 = pd.read_csv('lianjia2.csv', encoding='gbk')
data3 = pd.read_csv('lianjia3.csv', encoding='utf-8')
data4 = pd.read_csv('lianjia4.csv', encoding='utf-8')
data5 = pd.read_csv('lianjia5.csv', encoding='utf-8')
data6 = pd.read_csv('lianjia6.csv', encoding='utf-8')
data7 = pd.read_csv('lianjia7.csv', encoding='utf-8')
复制代码
data = pd.concat([data1, data2, data3, data4, data5,data6,data7])
复制代码
data.columns
复制代码
Index(['cjtaoshu', 'mendian', 'cjzongjia', 'zhiwei', 'haoping', 'cjdanjia',
       'cjxiaoqu', 'xingming', 'cjzhouqi', 'biaoqian', 'cjlouceng',
       'cjshijian', 'congyenianxian', 'bankuai'],
      dtype='object')
复制代码
data = data[['cjzongjia', 'cjdanjia', 'cjxiaoqu', 'cjlouceng', 'cjshijian', 'bankuai', 'mendian', 'xingming', 'congyenianxian', ]]
复制代码
data = data.dropna()
复制代码
data.cjdanjia = np.round(data.cjdanjia.str.replace('元/平','').astype(np.float32).map(lambda x: x/10000), 2)
复制代码
data.head()
复制代码
cjzongjiacjdanjiacjxiaoqucjloucengcjshijianbankuaimendianxingmingcongyenianxian
0251.04.40红莲北里 3室1厅 57平南 北/高楼层/6层签约时间:2015-05-24马连道红莲北里店郭海龙4-5年
1159.03.70红莲南里 1室1厅 43平南/高楼层/7层签约时间:2015-05-10马连道红莲北里店郭海龙4-5年
2257.03.90常青藤嘉园 1室1厅 65平北/低楼层/16层签约时间:2015-04-26马连道红莲北里店郭海龙4-5年
3243.04.13红莲北里 2室1厅 58平南 北/高楼层/6层签约时间:2015-04-04马连道红莲北里店郭海龙4-5年
4372.54.21广安门外大街 3室1厅 88平东 南 西 北/中楼层/18层签约时间:2015-04-01马连道红莲北里店郭海龙4-5年
data = data[data.cjshijian.str.contains('签约时间:')]
复制代码
data['cjshijian'] = pd.to_datetime(data.cjshijian.str.replace('签约时间:',''))
复制代码
data.head(3)
复制代码
cjzongjiacjdanjiacjxiaoqucjloucengcjshijianbankuaimendianxingmingcongyenianxian
0251.04.4红莲北里 3室1厅 57平南 北/高楼层/6层2015-05-24马连道红莲北里店郭海龙4-5年
1159.03.7红莲南里 1室1厅 43平南/高楼层/7层2015-05-10马连道红莲北里店郭海龙4-5年
2257.03.9常青藤嘉园 1室1厅 65平北/低楼层/16层2015-04-26马连道红莲北里店郭海龙4-5年
data.set_index('cjshijian', inplace=True)
复制代码
data.sort_index(inplace=True)
复制代码
data
复制代码
cjzongjiacjdanjiacjxiaoqucjloucengbankuaimendianxingmingcongyenianxian
cjshijian
2002-06-01152.51.71紫金新干线 2室2厅 89平南 北/中楼层/9层霍营龙锦东一店韩冀英5年以上
2003-07-31160.72.69天下儒寓 2室1厅 59平东 南/中楼层/28层科技园区中海国际店徐淑莹5年以上
2006-01-02160.01.65宏盛家园 2室2厅 97平南 北/低楼层/6层西红门鸿坤广场店刘振东5年以上
2006-01-02160.01.65宏盛家园 2室2厅 97平南 北/低楼层/6层西红门鸿坤广场店刘振东5年以上
2006-01-02160.01.65宏盛家园 2室2厅 97平南 北/低楼层/6层西红门鸿坤广场店刘振东5年以上
2010-09-25175.02.82半导体宿舍 2室1厅 62平南 北/低楼层/6层双榆树中关村东路临时店王雨5年以上
2010-09-25175.02.82半导体宿舍 2室1厅 62平南 北/低楼层/6层双榆树中关村东路临时店王雨5年以上
2011-01-21218.03.85花家地南里 2室1厅 56平南/中楼层/6层望京利泽西园店柳智远5年以上
2011-03-28168.03.15展春园 2室1厅 53平南 北/低楼层/6层双榆树中关村东路临时店王雨5年以上
2011-03-28168.03.15展春园 2室1厅 53平南 北/低楼层/6层双榆树中关村东路临时店王雨5年以上
2011-05-15530.04.08上元君庭 2室1厅 129平东 西/中楼层/31层奥林匹克公园世茂奥临新店赵晴5年以上
2011-05-31178.03.03朗琴园 1室1厅 58平东/中楼层/29层广安门远见国际店孙银5年以上
2011-06-02205.02.89车道沟南里 2室1厅 70平东 南/低楼层/17层紫竹桥车道沟南里店胡小刚5年以上
2011-06-02205.02.89车道沟南里 2室1厅 70平东 南/低楼层/17层紫竹桥车道沟南里店胡小刚5年以上
2011-06-02205.02.89车道沟南里 2室1厅 70平东 南/低楼层/17层紫竹桥车道沟南里店胡小刚5年以上
2011-06-03240.03.69双榆树北里 2室1厅 65平南/高楼层/6层双榆树双安店邹芳友5年以上
2011-06-05269.02.45芳城园一区 3室2厅 110平南 北/中楼层/26层方庄芳城园店阎浩5年以上
2011-06-11159.52.68京汉旭城 1室1厅 59平东 南/高楼层/23层鲁谷远洋山水一店冯丽琴5年以上
2011-06-1495.01.72林肯公园 1室1厅 55平西/中楼层/24层亦庄亦庄桥店宋九龙5年以上
2011-06-15270.04.15新风街 2室1厅 65平东 南/高楼层/16层德胜门马甸桥店刘景州5年以上
2011-06-16244.03.18安慧里二区 3室1厅 76平南 北/中楼层/25层亚运村洛克地铁站店刘宪峰5年以上
2011-06-19189.02.02万象新天四区 2室1厅 93平南/低楼层/9层常营新万象新天店王振雷5年以上
2011-06-19156.02.29广渠门外南街 2室1厅 68平南 西/高楼层/12层崇文门水上华城店白青龙5年以上
2011-06-2210.00.00万博苑 --室--厅 0平南 北/地下室/6层右安门内宣师一附小店郭亮5年以上
2011-06-22103.51.56金惠园三里 2室1厅 66平东 西/低楼层/7层黄村北翡翠城店范凌振5年以上
2011-06-23271.03.48牡丹园东里 3室1厅 77平南 北/高楼层/6层北太平庄花园北路店张志鹏5年以上
2011-06-23100.02.00万博苑 4室2厅 50平南 北/地下室/6层右安门内宣师一附小店郭亮5年以上
2011-06-2395.52.35永乐西区 1室1厅 40平南/中楼层/6层鲁谷远洋山水东门店张楠4-5年
2011-06-24157.02.48华威北里 2室1厅 63平南 西/高楼层/18层崇文门水上华城店白青龙5年以上
2011-06-25178.03.29富润家园 1室--厅 54平南/低楼层/18层学院路逸成东苑店李又林5年以上
...........................
2016-11-091315.07.68雍和家园一期 3室1厅 171平南 北/高楼层/16层和平里小街桥店刘广军5年以上
2016-11-09715.08.16北三环中路43号院 3室1厅 87平西南/中楼层/14层北太平庄冠城南园店赵海龙4-5年
2016-11-09266.34.25名佳花园一区 1室1厅 62平南 北/高楼层/6层北七家名佳花园三区临时店邵晓凡<1年
2016-11-09780.08.94金泰城丽湾 2室1厅 87平南 北/中楼层/18层菜户营金泰丽湾店贺佳铠<1年
2016-11-09233.06.30卡夫卡公社 1室1厅 36平南/中楼层/13层定福庄定福家园店刘佳宾2-3年
2016-11-09260.04.14中山大街108号院 1室1厅 62平南 北/中楼层/6层果园新华联广场店王春扬1-2年
2016-11-09336.05.85八里庄南里 2室1厅 57平西北/高楼层/18层十里堡慈云寺店李勇<1年
2016-11-09183.02.02鹭峯国际 2室1厅 90平北/中楼层/14层顺义城石园东苑店刘惠敏<1年
2016-11-0970.04.34华人一品阁 1室--厅 16平南/低楼层/3层朝阳门内史家小学店王亚楠<1年
2016-11-09450.08.72花园路14号院 2室1厅 51平南/中楼层/5层马甸花园公寓临时店刘刁4-5年
2016-11-09580.07.71逸成东苑 2室1厅 75平西南/中楼层/22层五道口逸成东苑店尚小龙1-2年
2016-11-09375.03.44天通苑北二区 2室2厅 109平南 北/中楼层/18层天通苑天通北苑二区店宋官军<1年
2016-11-09210.04.38中海城紫鑫阁 1室1厅 48平北/高楼层/20层成寿寺中海城紫鑫阁店徐芳<1年
2016-11-10339.04.37广安﹒康馨家园 2室1厅 77平南 北/低楼层/32层卢沟桥康馨家园店石永磊<1年
2016-11-10375.06.92泰悦豪庭 1室--厅 54平南/低楼层/22层三里屯富力爱丁堡店梁晓霞1-2年
2016-11-10379.07.66新纪家园 1室1厅 49平北/中楼层/21层太阳宫国际村店韩婷1-2年
2016-11-10396.05.71六里桥7号院 2室1厅 69平南 北/中楼层/5层六里桥风荷曲苑店赵雅南4-5年
2016-11-10339.04.37广安﹒康馨家园 2室1厅 77平南 北/低楼层/32层卢沟桥康馨家园店石永磊<1年
2016-11-10103.61.49熙旺中心 1室1厅 69平东/中楼层/25层门头沟其它梧桐苑店彭志和1-2年
2016-11-10579.02.63龙禧苑二区 5室2厅 220平南 北/高楼层/7层回龙观龙禧店王强<1年
2016-11-10289.04.96马家堡路8号院 2室1厅 58平东南/高楼层/6层洋桥西罗园旗舰店王云霞1-2年
2016-11-10542.08.42民族大学南路7号院 3室1厅 64平南 北/低楼层/5层白石桥主语城店罗静宇1-2年
2016-11-10760.04.98里外里公寓 3室2厅 152平南 北/低楼层/17层望京新城中心店许世宠5年以上
2016-11-10290.03.79仓上小区 3室1厅 76平东南/低楼层/6层顺义城石园东苑店方辛川4-5年
2016-11-10259.03.48新海北里 2室1厅 74平南 北/中楼层/6层马驹桥珠江逸景店姜尧1-2年
2016-11-11428.08.21西豪逸景 1室1厅 52平东/中楼层/28层广安门西豪小区店李静1-2年
2016-11-11240.02.78天洋城 2室1厅 86平南/低楼层/26层燕郊城区天洋城二店郝惠<1年
2016-11-11469.05.07新里.西斯莱公馆 3室1厅 92平南 北/中楼层/18层黄村中兴创屹墅店王玮1-2年
2016-11-11489.03.48金科王府 3室1厅 140平南 北/中楼层/9层北七家北京洋房店孙伟冬<1年
2016-11-11387.34.32玲珑天地 2室1厅 89平东北/中楼层/12层定慧寺定慧福里店赵倩<1年

160894 rows × 8 columns

data3 = data['2015-01-01' : '2015-09-30']
复制代码
data4 = data['2015-10-01' : '2015-12-31']
复制代码
data4
复制代码
cjzongjiacjdanjiacjxiaoqucjloucengbankuaimendianxingmingcongyenianxian
cjshijian
2015-10-01466.03.33柏林爱乐二期 3室2厅 140平南 北/高楼层/8层管庄管庄店江凯3-4年
2015-10-01335.03.54北苑家园茉藜园 2室1厅 94平南 北/高楼层/18层北苑茉藜园店王爱民5年以上
2015-10-01380.02.61立城苑 3室2厅 145平南 北/中楼层/6层北苑奥北中心南区店丁飞2-3年
2015-10-01211.01.98石园北区 3室2厅 106平南 北/中楼层/6层顺义城马坡新城店景盼盼1-2年
2015-10-01191.02.74芍药居北里 2室1厅 69平南 北/地下室/7层芍药居芍药居北里北门店王凯3-4年
2015-10-01135.01.36珠江逸景 2室1厅 99平东 北/高楼层/14层马驹桥融科店孙丽莎4-5年
2015-10-010.00.00长阳半岛1号院 --室--厅 88平暂无数据/低楼层/1层长阳长阳半岛店来宝根5年以上
2015-10-01280.05.53魏公村小区 2室1厅 50平南/中楼层/5层魏公村北理工店魏斌5年以上
2015-10-01240.02.75银地家园 3室1厅 87平南 西 北/中楼层/7层花乡风格店李盼盼2-3年
2015-10-010.00.00北京北 --室--厅 56平暂无数据/高楼层/20层立水桥新明天第一城店王杰5年以上
2015-10-011500.07.28富力城D区 4室2厅 205平南 北 西/低楼层/22层双井富力城旗舰店吴翠芝5年以上
2015-10-01266.02.80甘露园南里 2室1厅 94平南 北/低楼层/20层六铺炕阳光丽景北园店王国建5年以上
2015-10-01230.03.18大屯里小区 --室--厅 72平暂无数据/高楼层/28层亚运村新青年汇店李玉新5年以上
2015-10-01420.05.28学院南路66号院 3室1厅 79平南 西/低楼层/14层魏公村人济山庄一店王震5年以上
2015-10-01157.01.75城子西街1号院 2室1厅 89平南 北/高楼层/5层门头沟其它月季园店高金玲4-5年
2015-10-01390.06.08万泉河62号院 --室--厅 64平暂无数据/低楼层/6层苏州桥苏州街地铁店王诗嘉5年以上
2015-10-01168.02.16乔庄北区 2室1厅 77平南 北/高楼层/6层梨园梨园店田丽5年以上
2015-10-01559.05.55万泉河62号院 3室1厅 100平东 北/低楼层/16层苏州桥苏州街地铁店王诗嘉5年以上
2015-10-01528.05.32新兴年代 2室1厅 99平南/高楼层/18层五棵松五一小学学区临时店王凯5年以上
2015-10-01151.01.96和平家园小区 --室--厅 76平暂无数据/高楼层/12层东关京科苑临时一店曾建民1-2年
2015-10-01168.02.87龙华园 1室1厅 58平南 北/高楼层/6层霍营佰嘉城店胡艳荣5年以上
2015-10-010.00.00长阳半岛1号院 --室--厅 88平暂无数据/高楼层/21层长阳长阳半岛店来宝根5年以上
2015-10-01230.02.83龙华园 2室1厅 81平东 南 西/中楼层/6层霍营佰嘉城店胡艳荣5年以上
2015-10-01473.85.96水上华城 1室1厅 79平西/低楼层/23层广渠门水上华城店黄柳5年以上
2015-10-01335.03.54北苑家园茉藜园 2室1厅 94平南 北/高楼层/18层北苑茉藜园店王爱民5年以上
2015-10-01240.02.53大城小镇 2室1厅 94平西 南/低楼层/11层旧宫巧克力城一店张凯4-5年
2015-10-01330.06.75金尚嘉园 1室1厅 48平东/中楼层/14层燕郊城区星河皓月一店杜红梅5年以上
2015-10-01430.05.66花园路3号院 3室1厅 76平南 北/低楼层/6层燕郊城区星河皓月一店杜红梅5年以上
2015-10-01305.03.49金地仰山 3室1厅 87平南 北/中楼层/18层黄村北翡翠城店杨建坤2-3年
2015-10-01486.05.24和平里五区 3室1厅 92平南 北/高楼层/6层和平里和平里六区一店王银川5年以上
...........................
2015-12-31320.02.69站前巴黎 3室2厅 119平南 北/高楼层/6层梨园新时尚街区店黄灿5年以上
2015-12-31525.04.10怡海花园恒丰园 2室2厅 128平南/高楼层/22层花乡怡海旗舰店田大江5年以上
2015-12-31480.02.80富力又一城B区 3室2厅 171平南 北/高楼层/20层豆各庄新富力又一城三店马维5年以上
2015-12-31465.05.17嘉铭园 3室1厅 89平西南/高楼层/6层芍药居芍药居社区店李祥胜1-2年
2015-12-31330.05.32东直门北大街 2室1厅 61平东 西/高楼层/12层国展柳芳店杜倩5年以上
2015-12-31420.07.22东南小区 2室1厅 58平南 北/高楼层/12层双榆树中关村中学店朱涛5年以上
2015-12-31379.07.42铁路巷 2室1厅 51平南 北/低楼层/5层西直门西直门华堂店王鹏5年以上
2015-12-31159.02.52天通苑东三区 1室1厅 63平南 北/中楼层/6层回龙观龙博苑店冀勇亮3-4年
2015-12-31358.03.76北京新天地 2室1厅 95平东南/高楼层/27层管庄北京新天地店吴志男5年以上
2015-12-31339.04.33晨光家园 2室1厅 78平西南/低楼层/30层十里堡晨光家园店车玉阳3-4年
2015-12-31176.52.47晓月苑二里 2室1厅 71平南 北/中楼层/6层卢沟桥沸城临时一店陈婷2-3年
2015-12-31532.07.43安德馨居 2室1厅 71平东 西/低楼层/6层六铺炕鼓楼店尚靖5年以上
2015-12-31186.03.22西大望路 2室1厅 57平南 北/高楼层/7层红庙红庙店李涛1-2年
2015-12-31290.02.12龙湖香醍漫步四区南区 3室2厅 136平南 北/中楼层/8层顺义城裕龙一店温萍萍5年以上
2015-12-31145.01.50潮白星光公馆 2室2厅 96平东南/中楼层/24层燕郊城区星河皓月一店雷宇4-5年
2015-12-31317.03.76幸福时光 2室1厅 84平南 北/高楼层/6层回龙观云趣园小区店孔相瑞5年以上
2015-12-31150.01.33朝阳园 1室1厅 112平西/中楼层/29层和平里和平里六区一店刘如意2-3年
2015-12-31124.02.23上潞园 1室2厅 55平东 南/高楼层/6层潞苑珠江国际店祝建军1-2年
2015-12-31720.05.82珠江帝景 2室2厅 123平西南/中楼层/26层大望路珠江帝景三店黄友超5年以上
2015-12-31132.01.66樱花园一区 2室1厅 79平东南/高楼层/6层首都机场馨港商业街店马占一1-2年
2015-12-31318.04.02华威西里 2室1厅 79平南/中楼层/22层劲松劲松西口店徐天2-3年
2015-12-31270.03.54前泥洼小区 2室1厅 76平南 北/中楼层/6层西红门兴海家园店王安东5年以上
2015-12-31251.04.32永泰东里 2室1厅 58平东 西/高楼层/6层清河清河店徐松华5年以上
2015-12-31151.02.86花园闸小区 2室1厅 52平北/低楼层/18层定福庄新定福庄店李占伟5年以上
2015-12-31498.06.55东直门内北小街16号 2室1厅 76平东 西/高楼层/10层东直门安德馨居店海奎5年以上
2015-12-31169.04.04中海御鑫阁 1室--厅 41平南/高楼层/20层科技园区中海国际店白霞1-2年
2015-12-31465.05.17嘉铭园 3室1厅 89平西南/高楼层/6层芍药居芍药居社区店李祥胜1-2年
2015-12-31365.06.41东厂胡同 2室1厅 56平南 北/高楼层/6层朝阳门内灯市口一店陈倩如3-4年
2015-12-31537.06.18半壁街南路1号院 3室1厅 86平南 西 北/中楼层/24层紫竹桥理工附中店薛帅国1-2年
2015-12-31154.02.62模式口东里 2室1厅 58平东 南/低楼层/16层苹果园金顶北街店张博学5年以上

15019 rows × 8 columns

data3 = data3.assign(xiaoqu = data3.cjxiaoqu.map(lambda x : x.split()[0]))
复制代码
a116 = data3.xiaoqu.value_counts()[data3.xiaoqu.value_counts() > 5].index
复制代码
data3 = data3[data3.xiaoqu.isin(a116)]
复制代码
data3_m = data3.groupby('xiaoqu').cjdanjia.mean()
复制代码
data4 = data4.assign(xiaoqu = data4.cjxiaoqu.map(lambda x : x.split()[0]))
复制代码
data4 = data4[data4.xiaoqu.isin(a116)]
复制代码
data4_m = data4.groupby('xiaoqu').cjdanjia.mean()
复制代码
xq_up = (data4_m - data3_m)/data3_m
复制代码
(xq_up > 0.1).sum()
复制代码
598
复制代码
xq_up = xq_up.dropna()
复制代码
type(xq_up)
复制代码
pandas.core.series.Series
复制代码
xq_up = xq_up.to_frame()
xq_up
复制代码
cjdanjia
xiaoqu
10AM新坐标0.029167
11站0.176294
7克拉-0.084072
@北京0.150740
BOBO自由城0.190198
CBD传奇0.047947
CBD总部公寓一期0.034339
DBC加州小镇0.147267
DBC加州小镇C区0.340723
K2清水湾0.210142
SOCO公社0.025779
SOHO现代城0.025157
UHN国际村0.018182
gogo新世代-0.019223
iMOMA-0.106553
一品亦庄-0.071705
七星园-0.118217
七贤村0.084302
万博苑-0.070674
万国城MOMA-0.031224
万寿园0.097382
万寿路1号院0.152135
万寿路甲15号院五区0.123483
万寿路甲15号院四区0.127674
万寿路西街11号院0.174028
万年花城三期0.063505
万年花城二期0.144477
万年花城五期0.071732
万年花城四期-0.080442
万恒家园0.085331
......
龙湖时代天街0.076194
龙湖花盛香醍0.225815
龙湖蔚澜香醍0.170194
龙湖香醍漫步一区-0.044834
龙湖香醍漫步二区0.175217
龙湖香醍漫步四区北区0.157096
龙湖香醍漫步四区南区0.008978
龙禧苑一区-0.063383
龙翔路小区0.078258
龙腾苑三区-0.000943
龙腾苑二区0.014377
龙腾苑五区0.184534
龙腾苑六区-0.004383
龙腾苑四区-0.030092
龙跃苑一区-0.033465
龙跃苑三区0.153478
龙跃苑东二区-0.075813
龙跃苑东五区0.178068
龙跃苑东四区0.034004
龙跃苑二区0.004402
龙跃苑四区0.026828
龙锦苑东一区0.010374
龙锦苑东三区-0.010902
龙锦苑东二区0.027718
龙锦苑东五区0.072558
龙锦苑东四区-0.068640
龙锦苑二区0.105667
龙锦苑六区0.083662
龙锦苑四区-0.088337
龙鼎园0.212195

1606 rows × 1 columns

xq_up = xq_up.assign(zhangfu = (xq_up.cjdanjia > 0.1).astype('int'))
复制代码
data3.columns
复制代码
Index(['cjzongjia', 'cjdanjia', 'cjxiaoqu', 'cjlouceng', 'bankuai', 'mendian',
       'xingming', 'congyenianxian', 'xiaoqu'],
      dtype='object')
复制代码
data_taoshu = data3.groupby('xiaoqu').count()['cjxiaoqu'].to_frame().rename(columns={'cjxiaoqu':'taoshu'})
复制代码
data_taoshu
复制代码
taoshu
xiaoqu
10AM新坐标19
11站11
7克拉13
@北京6
BOBO自由城28
CBD传奇17
CBD总部公寓一期11
DBC加州小镇36
DBC加州小镇C区28
K2清水湾27
SOCO公社10
SOHO现代城7
UHN国际村8
gogo新世代23
iMOMA7
一品亦庄6
七星园26
七贤村8
万博苑8
万国城MOMA6
万寿园10
万寿寺北里7
万寿路1号院12
万寿路甲15号院五区10
万寿路甲15号院四区8
万寿路西街11号院9
万年花城三期15
万年花城二期15
万年花城五期8
万年花城四期27
......
龙湖时代天街12
龙湖花盛香醍14
龙湖蔚澜香醍16
龙湖香醍漫步一区7
龙湖香醍漫步二区6
龙湖香醍漫步四区北区11
龙湖香醍漫步四区南区8
龙禧苑一区11
龙翔路小区24
龙腾苑三区16
龙腾苑二区9
龙腾苑五区10
龙腾苑六区16
龙腾苑四区23
龙跃苑一区21
龙跃苑三区16
龙跃苑东二区10
龙跃苑东五区16
龙跃苑东四区15
龙跃苑二区14
龙跃苑四区16
龙锦苑东一区33
龙锦苑东三区15
龙锦苑东二区12
龙锦苑东五区32
龙锦苑东四区17
龙锦苑二区9
龙锦苑六区15
龙锦苑四区11
龙鼎园21

1728 rows × 1 columns

data = pd.merge(xq_up, data_taoshu, left_index=True, right_index=True, how='left')
复制代码
data.head(3)
复制代码
cjdanjiazhangfutaoshu
xiaoqu
10AM新坐标0.029167019
11站0.176294111
7克拉-0.084072013
del data['cjdanjia']
复制代码
data_danjia = data3.groupby('xiaoqu').cjdanjia.mean().to_frame()
复制代码
data = pd.merge(data, data_danjia, left_index=True, right_index=True, how='left')
复制代码
data_zongjia = data3.groupby('xiaoqu').cjzongjia.mean().to_frame()
复制代码
data = pd.merge(data, data_zongjia, left_index=True, right_index=True, how='left')
复制代码
index = np.random.permutation(len(data))
复制代码
data_train = data.iloc[index[: int(0.7 * len(data))]]
复制代码
data_test = data.iloc[index[int(0.7 * len(data))]:]
复制代码
x_train, y_train = data[['taoshu', 'cjdanjia', 'cjzongjia']], data.zhangfu
复制代码
x_train.head(3)
复制代码
taoshucjdanjiacjzongjia
xiaoqu
10AM新坐标193.431579178.410526
11站112.352727173.736364
7克拉133.601538130.538462
x_test, y_test = data[['taoshu', 'cjdanjia', 'cjzongjia']], data.zhangfu
复制代码
from sklearn.linear_model import LogisticRegression
复制代码
model = LogisticRegression()
复制代码
model.fit(x_train, y_train)
复制代码
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
          intercept_scaling=1, max_iter=100, multi_class='ovr', n_jobs=1,
          penalty='l2', random_state=None, solver='liblinear', tol=0.0001,
          verbose=0, warm_start=False)
复制代码
model.score(x_test,y_test)
复制代码
0.6282689912826899
复制代码
data_jjr_num = data3.groupby('xiaoqu').xingming.unique().map(len).to_frame()
复制代码
data = pd.merge(data, data_jjr_num, left_index=True, right_index=True, how='left')
复制代码
data.head(3)
复制代码
zhangfutaoshucjdanjiacjzongjiaxingming
xiaoqu
10AM新坐标0193.431579178.41052610
11站1112.352727173.73636410
7克拉0133.601538130.5384628
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值