数据来源链家租房网站。随机爬虫了5000多数据。删除了信息相同的一部分信息。余下的会从五个维度进行分析!
01各个城区房源数量对比(横柱状图) 02各种户型之间数量对比(横柱状图)(删除了部分数量太少的户型) 03各个城区租金对比(柱状图和折线统计图) 04面积区间分布图(饼状图) 05房屋朝向不同的房屋价格对比(柱状图和折线统计图)
import pandas as pd
import matplotlib. pyplot as plt
import numpy as np
import seaborn as sns
处理中文字符无法正常显示
from pylab import mpl
mpl. rcParams[ "font.sans-serif" ] = [ "SimHei" ]
mpl. rcParams[ "axes.unicode_minus" ] = False
1、数据处理分析准备
1.1、导入数据
data = pd. read_csv( "./shenzhenlianjia.csv" , encoding= 'gbk' )
data
城区 小区 面积 房间格局 方向 价格 0 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 东南 1500 1 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 西北 1800 2 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 南 1800 3 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 东南 1800 4 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 东南 1800 ... ... ... ... ... ... ... 4320 福田区 特区报社宿舍楼 14㎡ 5室1厅2卫 西 2390 4321 南山区 佳兆业前海广场一期 88㎡ 4室2厅1卫 东南 9500 4322 福田区 锦林新居 17㎡ 3室1厅1卫 南 2560 4323 福田区 众孚大厦 7㎡ 4室1厅2卫 东南 1790 4324 龙岗区 东方半岛花园A区 13㎡ 4室1厅2卫 西北 1660
4325 rows × 6 columns
1.2、处理重复值
data. duplicated( )
data. shape
(4325, 6)
data = data. drop_duplicates( )
data = data[ data[ '城区' ] != '城区' ]
data
城区 小区 面积 房间格局 方向 价格 0 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 东南 1500 1 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 西北 1800 2 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 南 1800 3 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 东南 1800 6 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 南 2000 ... ... ... ... ... ... ... 4320 福田区 特区报社宿舍楼 14㎡ 5室1厅2卫 西 2390 4321 南山区 佳兆业前海广场一期 88㎡ 4室2厅1卫 东南 9500 4322 福田区 锦林新居 17㎡ 3室1厅1卫 南 2560 4323 福田区 众孚大厦 7㎡ 4室1厅2卫 东南 1790 4324 龙岗区 东方半岛花园A区 13㎡ 4室1厅2卫 西北 1660
2762 rows × 6 columns
data. shape
(2762, 6)
1.3、数据类型转换
data_area_new = np. array( [ ] )
data_area = data[ '面积' ] . values
data_area
data
城区 小区 面积 房间格局 方向 价格 0 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 东南 1500 1 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 西北 1800 2 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 南 1800 3 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 东南 1800 6 大鹏新区 承翰半山海 36㎡ 1室1厅1卫 南 2000 ... ... ... ... ... ... ... 4320 福田区 特区报社宿舍楼 14㎡ 5室1厅2卫 西 2390 4321 南山区 佳兆业前海广场一期 88㎡ 4室2厅1卫 东南 9500 4322 福田区 锦林新居 17㎡ 3室1厅1卫 南 2560 4323 福田区 众孚大厦 7㎡ 4室1厅2卫 东南 1790 4324 龙岗区 东方半岛花园A区 13㎡ 4室1厅2卫 西北 1660
2762 rows × 6 columns
for i in data_area:
data_area_new = np. append( data_area_new, np. array( i[ : - 1 ] ) )
data_area_new = data_area_new. astype( np. float64)
data. loc[ : , '面积' ] = data_area_new
dataprice = data[ '价格' ] . astype( np. float64)
data. loc[ : , '价格' ] = dataprice
data
城区 小区 面积 房间格局 方向 价格 0 大鹏新区 承翰半山海 36.0 1室1厅1卫 东南 1500.0 1 大鹏新区 承翰半山海 36.0 1室1厅1卫 西北 1800.0 2 大鹏新区 承翰半山海 36.0 1室1厅1卫 南 1800.0 3 大鹏新区 承翰半山海 36.0 1室1厅1卫 东南 1800.0 6 大鹏新区 承翰半山海 36.0 1室1厅1卫 南 2000.0 ... ... ... ... ... ... ... 4320 福田区 特区报社宿舍楼 14.0 5室1厅2卫 西 2390.0 4321 南山区 佳兆业前海广场一期 88.0 4室2厅1卫 东南 9500.0 4322 福田区 锦林新居 17.0 3室1厅1卫 南 2560.0 4323 福田区 众孚大厦 7.0 4室1厅2卫 东南 1790.0 4324 龙岗区 东方半岛花园A区 13.0 4室1厅2卫 西北 1660.0
2762 rows × 6 columns
2、房源数量,位置分布分析
2.1、各城区房源数量对比(横柱状图)
num = data[ '城区' ] . nunique( )
num
10
area_df = pd. DataFrame( { '城区' : data[ '城区' ] . unique( ) , '数量' : [ 0 ] * num} )
area_df
城区 数量 0 大鹏新区 0 1 龙岗区 0 2 盐田区 0 3 南山区 0 4 坪山区 0 5 龙华区 0 6 宝安区 0 7 罗湖区 0 8 光明区 0 9 福田区 0
grouparea = data. groupby( by= '城区' ) . count( )
grouparea
小区 面积 房间格局 方向 价格 城区 光明区 22 22 22 22 22 南山区 458 458 458 458 458 坪山区 50 50 50 50 50 大鹏新区 71 71 71 71 71 宝安区 288 288 288 288 288 盐田区 66 66 66 66 66 福田区 570 570 570 570 570 罗湖区 428 428 428 428 428 龙华区 245 245 245 245 245 龙岗区 564 564 564 564 564
area_df[ '数量' ] = grouparea. values
area_df
城区 数量 0 大鹏新区 22 1 龙岗区 458 2 盐田区 50 3 南山区 71 4 坪山区 288 5 龙华区 66 6 宝安区 570 7 罗湖区 428 8 光明区 245 9 福田区 564
area_df. sort_values( by= '数量' , ascending= False )
城区 数量 6 宝安区 570 9 福田区 564 1 龙岗区 458 7 罗湖区 428 4 坪山区 288 8 光明区 245 3 南山区 71 5 龙华区 66 2 盐田区 50 0 大鹏新区 22
distance_type = area_df[ '城区' ]
num_type = area_df[ '数量' ]
plt. figure( figsize= ( 20 , 13 ) , dpi= 100 )
plt. barh( range ( 10 ) , num_type, height= 0.7 )
plt. yticks( range ( 10 ) , distance_type)
plt. xlim( 0 , 600 )
plt. xlabel( '数量' )
plt. ylabel( '城区' )
plt. title( '深圳市各城区租房数量' )
for x, y in enumerate ( num_type) :
plt. text( y+ 0.5 , x, '%s' % y)
plt. show( )
2.2、各户型数量分析(横柱状图)
这里的户型太多了,有些户型太少,所以进行了取舍,舍弃户型数量小于的50的,只需要分析户型大于50的!
num = data[ '房间格局' ] . nunique( )
num
52
room_df = pd. DataFrame( { '房间格局' : data[ '房间格局' ] . unique( ) , '数量' : [ 0 ] * num} )
room_df
房间格局 数量 0 1室1厅1卫 0 1 1室0厅1卫 0 2 2室2厅1卫 0 3 2室1厅1卫 0 4 3室2厅1卫 0 5 3室2厅2卫 0 6 4室2厅2卫 0 7 3室1厅3卫 0 8 3室1厅2卫 0 9 8室2厅5卫 0 10 5室2厅5卫 0 11 5室3厅5卫 0 12 3室1厅1卫 0 13 6室2厅4卫 0 14 6室2厅3卫 0 15 2室2厅2卫 0 16 3室2厅3卫 0 17 1室1厅2卫 0 18 4室2厅4卫 0 19 4室1厅1卫 0 20 4室1厅2卫 0 21 4室3厅4卫 0 22 5室1厅2卫 0 23 1室0厅0卫 0 24 3室0厅4卫 0 25 5室0厅1卫 0 26 5室1厅1卫 0 27 1室0厅2卫 0 28 5室0厅5卫 0 29 5室0厅4卫 0 30 1室1厅0卫 0 31 5室1厅3卫 0 32 2室1厅2卫 0 33 5室2厅4卫 0 34 1室2厅1卫 0 35 5室1厅4卫 0 36 5室0厅2卫 0 37 2室0厅1卫 0 38 4室0厅1卫 0 39 2室1厅0卫 0 40 4室1厅3卫 0 41 4室2厅1卫 0 42 5室1厅5卫 0 43 5室0厅3卫 0 44 未知室1厅1卫 0 45 未知室0厅0卫 0 46 5室2厅2卫 0 47 2室0厅2卫 0 48 6室1厅3卫 0 49 4室0厅4卫 0 50 2室2厅3卫 0 51 6室2厅2卫 0
grouproom = data. groupby( by= '房间格局' ) . count( )
grouproom
城区 小区 面积 方向 价格 房间格局 1室0厅0卫 21 21 21 21 21 1室0厅1卫 453 453 453 453 453 1室0厅2卫 1 1 1 1 1 1室1厅0卫 6 6 6 6 6 1室1厅1卫 521 521 521 521 521 1室1厅2卫 2 2 2 2 2 1室2厅1卫 5 5 5 5 5 2室0厅1卫 6 6 6 6 6 2室0厅2卫 1 1 1 1 1 2室1厅0卫 1 1 1 1 1 2室1厅1卫 366 366 366 366 366 2室1厅2卫 5 5 5 5 5 2室2厅1卫 106 106 106 106 106 2室2厅2卫 13 13 13 13 13 2室2厅3卫 1 1 1 1 1 3室0厅4卫 1 1 1 1 1 3室1厅1卫 213 213 213 213 213 3室1厅2卫 58 58 58 58 58 3室1厅3卫 3 3 3 3 3 3室2厅1卫 109 109 109 109 109 3室2厅2卫 76 76 76 76 76 3室2厅3卫 1 1 1 1 1 4室0厅1卫 6 6 6 6 6 4室0厅4卫 1 1 1 1 1 4室1厅1卫 278 278 278 278 278 4室1厅2卫 196 196 196 196 196 4室1厅3卫 3 3 3 3 3 4室2厅1卫 5 5 5 5 5 4室2厅2卫 31 31 31 31 31 4室2厅4卫 3 3 3 3 3 4室3厅4卫 1 1 1 1 1 5室0厅1卫 8 8 8 8 8 5室0厅2卫 2 2 2 2 2 5室0厅3卫 3 3 3 3 3 5室0厅4卫 4 4 4 4 4 5室0厅5卫 18 18 18 18 18 5室1厅1卫 47 47 47 47 47 5室1厅2卫 156 156 156 156 156 5室1厅3卫 13 13 13 13 13 5室1厅4卫 2 2 2 2 2 5室1厅5卫 3 3 3 3 3 5室2厅2卫 2 2 2 2 2 5室2厅4卫 1 1 1 1 1 5室2厅5卫 2 2 2 2 2 5室3厅5卫 1 1 1 1 1 6室1厅3卫 1 1 1 1 1 6室2厅2卫 1 1 1 1 1 6室2厅3卫 1 1 1 1 1 6室2厅4卫 1 1 1 1 1 8室2厅5卫 1 1 1 1 1 未知室0厅0卫 1 1 1 1 1 未知室1厅1卫 1 1 1 1 1
room_df[ '数量' ] = grouproom. values
room_df
房间格局 数量 0 1室1厅1卫 21 1 1室0厅1卫 453 2 2室2厅1卫 1 3 2室1厅1卫 6 4 3室2厅1卫 521 5 3室2厅2卫 2 6 4室2厅2卫 5 7 3室1厅3卫 6 8 3室1厅2卫 1 9 8室2厅5卫 1 10 5室2厅5卫 366 11 5室3厅5卫 5 12 3室1厅1卫 106 13 6室2厅4卫 13 14 6室2厅3卫 1 15 2室2厅2卫 1 16 3室2厅3卫 213 17 1室1厅2卫 58 18 4室2厅4卫 3 19 4室1厅1卫 109 20 4室1厅2卫 76 21 4室3厅4卫 1 22 5室1厅2卫 6 23 1室0厅0卫 1 24 3室0厅4卫 278 25 5室0厅1卫 196 26 5室1厅1卫 3 27 1室0厅2卫 5 28 5室0厅5卫 31 29 5室0厅4卫 3 30 1室1厅0卫 1 31 5室1厅3卫 8 32 2室1厅2卫 2 33 5室2厅4卫 3 34 1室2厅1卫 4 35 5室1厅4卫 18 36 5室0厅2卫 47 37 2室0厅1卫 156 38 4室0厅1卫 13 39 2室1厅0卫 2 40 4室1厅3卫 3 41 4室2厅1卫 2 42 5室1厅5卫 1 43 5室0厅3卫 2 44 未知室1厅1卫 1 45 未知室0厅0卫 1 46 5室2厅2卫 1 47 2室0厅2卫 1 48 6室1厅3卫 1 49 4室0厅4卫 1 50 2室2厅3卫 1 51 6室2厅2卫 1
room_df = room_df[ room_df[ '数量' ] > 50 ]
room_df
房间格局 数量 1 1室0厅1卫 453 4 3室2厅1卫 521 10 5室2厅5卫 366 12 3室1厅1卫 106 16 3室2厅3卫 213 17 1室1厅2卫 58 19 4室1厅1卫 109 20 4室1厅2卫 76 24 3室0厅4卫 278 25 5室0厅1卫 196 37 2室0厅1卫 156
num = room_df. shape[ 0 ]
num
11
house_type = room_df[ '房间格局' ]
num_type = room_df[ '数量' ]
plt. figure( figsize= ( 20 , 13 ) , dpi= 100 )
plt. barh( range ( num) , num_type, height= 0.7 )
plt. yticks( range ( num) , house_type)
plt. xlim( 0 , 550 )
plt. xlabel( '数量' )
plt. ylabel( '房间类型' )
plt. title( '深圳市租房主要户型' )
for x, y in enumerate ( num_type) :
plt. text( y, x, '%s' % y)
plt. show( )
2.3、各个城区平均租金(柱状图和折线图)
mean_df = pd. DataFrame(
{ '城区' : data[ '城区' ] . unique( ) , '房租总金额' : [ 0 ] * 10 , '总面积' : [ 0 ] * 10 } )
mean_df
城区 房租总金额 总面积 0 大鹏新区 0 0 1 龙岗区 0 0 2 盐田区 0 0 3 南山区 0 0 4 坪山区 0 0 5 龙华区 0 0 6 宝安区 0 0 7 罗湖区 0 0 8 光明区 0 0 9 福田区 0 0
sum_price = data[ '价格' ] . groupby( data[ '城区' ] ) . sum ( )
sum_price
城区
光明区 87100.0
南山区 1786082.0
坪山区 135056.0
大鹏新区 318690.0
宝安区 992655.0
盐田区 222521.0
福田区 1812617.0
罗湖区 1320652.0
龙华区 731725.0
龙岗区 1510020.0
Name: 价格, dtype: float64
sum_area = data[ '面积' ] . groupby( data[ '城区' ] ) . sum ( )
sum_area
城区
光明区 1821.0
南山区 13555.0
坪山区 3422.0
大鹏新区 5664.0
宝安区 14348.0
盐田区 4017.0
福田区 15982.0
罗湖区 14374.0
龙华区 11286.0
龙岗区 28506.0
Name: 面积, dtype: float64
mean_df[ '总面积' ] = sum_area. values
mean_df[ '房租总金额' ] = sum_price. values
mean_df
城区 房租总金额 总面积 0 大鹏新区 87100.0 1821.0 1 龙岗区 1786082.0 13555.0 2 盐田区 135056.0 3422.0 3 南山区 318690.0 5664.0 4 坪山区 992655.0 14348.0 5 龙华区 222521.0 4017.0 6 宝安区 1812617.0 15982.0 7 罗湖区 1320652.0 14374.0 8 光明区 731725.0 11286.0 9 福田区 1510020.0 28506.0
mean_df[ '每平米租金(元)' ] = round ( mean_df[ '房租总金额' ] / mean_df[ '总面积' ] , 2 )
mean_df
城区 房租总金额 总面积 每平米租金(元) 0 大鹏新区 87100.0 1821.0 47.83 1 龙岗区 1786082.0 13555.0 131.77 2 盐田区 135056.0 3422.0 39.47 3 南山区 318690.0 5664.0 56.27 4 坪山区 992655.0 14348.0 69.18 5 龙华区 222521.0 4017.0 55.39 6 宝安区 1812617.0 15982.0 113.42 7 罗湖区 1320652.0 14374.0 91.88 8 光明区 731725.0 11286.0 64.83 9 福田区 1510020.0 28506.0 52.97
df_merge = pd. merge( area_df, mean_df)
df_merge
城区 数量 房租总金额 总面积 每平米租金(元) 0 大鹏新区 22 87100.0 1821.0 47.83 1 龙岗区 458 1786082.0 13555.0 131.77 2 盐田区 50 135056.0 3422.0 39.47 3 南山区 71 318690.0 5664.0 56.27 4 坪山区 288 992655.0 14348.0 69.18 5 龙华区 66 222521.0 4017.0 55.39 6 宝安区 570 1812617.0 15982.0 113.42 7 罗湖区 428 1320652.0 14374.0 91.88 8 光明区 245 731725.0 11286.0 64.83 9 福田区 564 1510020.0 28506.0 52.97
num = df_merge[ '数量' ]
price = df_merge[ '每平米租金(元)' ]
l = [ i for i in range ( 10 ) ]
lx = df_merge[ '城区' ]
fig = plt. figure( figsize= ( 15 , 10 ) , dpi= 100 )
ax1 = fig. add_subplot( 111 )
ax1. plot( l, price, 'or-' , label= '价格' )
for i, ( _x, _y) in enumerate ( zip ( l, price) ) :
plt. text( _x+ 0.1 , _y, price[ i] )
ax1. set_ylim( [ 0 , 160 ] )
ax1. set_ylabel( '价格/平米' )
plt. legend( loc= 'upper left' )
ax2 = ax1. twinx( )
plt. bar( l, num, alpha= 0.3 , color= 'green' , label= '数量' )
ax2. set_ylabel( '数量' )
plt. legend( loc= 'upper right' )
plt. xticks( l, lx)
plt. title( '深圳市各区租房数量与价格' )
plt. show( )
2.4、面积区间分析(饼状图)
print ( '房屋最贵是{}元每月' . format ( data[ '价格' ] . max ( ) ) )
print ( '房屋最便宜是{}元每月' . format ( data[ '价格' ] . min ( ) ) )
房屋最贵是180000.0元每月
房屋最便宜是950.0元每月
print ( '房屋最大面积是{}平方米' . format ( data[ '面积' ] . max ( ) ) )
print ( '房屋最小面积是{}平方米' . format ( data[ '面积' ] . min ( ) ) )
房屋最大面积是830.0平方米
房屋最小面积是5.0平方米
area_divide = [ 0 , 8 , 15 , 25 , 40 , 55 , 70 , 90 , 120 , 850 ]
area_cut = pd. cut( list ( data[ '面积' ] ) , area_divide)
area_cut_data = area_cut. describe( )
area_cut_data
counts freqs categories (0, 8] 312 0.112962 (8, 15] 505 0.182839 (15, 25] 207 0.074946 (25, 40] 583 0.211079 (40, 55] 418 0.151340 (55, 70] 227 0.082187 (70, 90] 382 0.138306 (90, 120] 95 0.034395 (120, 850] 33 0.011948
area_percentage = ( area_cut_data[ 'freqs' ] . values) * 100
area_percentage
array([11.2961622 , 18.28385228, 7.49456915, 21.10789283, 15.1339609 ,
8.21868211, 13.83055757, 3.43953657, 1.19478639])
labels = [ '8平米以下' , '8-15平米' , '15-25平米' , '25-40平米' , '40-55平米' , '55-70平米' , '70-90平米' ,
'90-120平米' , '120平米以上' ]
plt. figure( figsize= ( 20 , 10 ) , dpi= 100 )
plt. axes( aspect= 1 )
plt. pie( x= area_percentage, labels= labels, autopct= '%.2f %%' , shadow= True )
plt. legend( loc= 'best' )
plt. title( '深圳市租房面积区间统计图' )
plt. show
<function matplotlib.pyplot.show(*args, **kw)>
2.5、朝向对于价格影响(柱状图和折线图)
face_df_value = data[ '方向' ] . unique( )
face_df_value
array(['东南', '西北', '南', '西', '西南', '东', '北', '东北'], dtype=object)
face_df = pd. DataFrame( { '方向' : data[ '方向' ] . unique( ) , '数量' : [
0 ] * face_df_value. shape[ 0 ] , '总价格' : [ 0 ] * face_df_value. shape[ 0 ] , '总面积' : [ 0 ] * face_df_value. shape[ 0 ] } )
face_df
方向 数量 总价格 总面积 0 东南 0 0 0 1 西北 0 0 0 2 南 0 0 0 3 西 0 0 0 4 西南 0 0 0 5 东 0 0 0 6 北 0 0 0 7 东北 0 0 0
num_sum = data. groupby( by= data[ '方向' ] ) . count( )
num_sum
城区 小区 面积 房间格局 价格 方向 东 266 266 266 266 266 东北 83 83 83 83 83 东南 590 590 590 590 590 北 406 406 406 406 406 南 1010 1010 1010 1010 1010 西 139 139 139 139 139 西北 108 108 108 108 108 西南 160 160 160 160 160
price_sum = data[ '价格' ] . groupby( by= data[ '方向' ] ) . sum ( )
price_sum
方向
东 846353.0
东北 259858.0
东南 2281168.0
北 1149286.0
南 3158155.0
西 388531.0
西北 332181.0
西南 501586.0
Name: 价格, dtype: float64
area_sum = data[ '面积' ] . groupby( by= data[ '方向' ] ) . sum ( )
area_sum
方向
东 9311.0
东北 3275.0
东南 32360.0
北 10820.0
南 42690.0
西 3198.0
西北 3706.0
西南 7615.0
Name: 面积, dtype: float64
face_df[ '数量' ] = num_sum. values
face_df[ '总价格' ] = price_sum. values
face_df[ '总面积' ] = area_sum. values
face_df
方向 数量 总价格 总面积 0 东南 266 846353.0 9311.0 1 西北 83 259858.0 3275.0 2 南 590 2281168.0 32360.0 3 西 406 1149286.0 10820.0 4 西南 1010 3158155.0 42690.0 5 东 139 388531.0 3198.0 6 北 108 332181.0 3706.0 7 东北 160 501586.0 7615.0
face_df[ '平均价格' ] = round ( face_df[ '总价格' ] / face_df[ '总面积' ] , 2 )
face_df
方向 数量 总价格 总面积 平均价格 0 东南 266 846353.0 9311.0 90.90 1 西北 83 259858.0 3275.0 79.35 2 南 590 2281168.0 32360.0 70.49 3 西 406 1149286.0 10820.0 106.22 4 西南 1010 3158155.0 42690.0 73.98 5 东 139 388531.0 3198.0 121.49 6 北 108 332181.0 3706.0 89.63 7 东北 160 501586.0 7615.0 65.87
l = [ i for i in range ( 8 ) ]
_num = face_df[ '数量' ]
_meanprice = face_df[ '平均价格' ]
fig = plt. figure( figsize= ( 20 , 8 ) , dpi= 100 )
ax3 = fig. add_subplot( 111 )
ax3. bar( l, _num, label= '数量' , alpha= 0.5 , color= 'green' )
ax3. set_ylabel( '数量' )
ax3. set_ylim( 0 , 1200 )
plt. legend( loc= 'upper left' )
for x, y in enumerate ( _num) :
plt. text( x- 0.1 , y+ 18 , '%s' % y)
plt. xticks( l, face_df[ '方向' ] )
ax4 = ax3. twinx( )
plt. plot( l, _meanprice, 'or-' , label= '价格' )
ax4. legend( loc= 'upper right' )
ax4. set_ylim( 0 , 150 )
ax4. set_ylabel( '价格' )
for i, ( _x, _y) in enumerate ( zip ( l, _meanprice) ) :
plt. text( _x+ 0.1 , _y- 0.1 , _meanprice[ i] )
plt. title( '深圳租房朝向对价格影响' )
plt. show( )
3、结语
主要来深圳一段时间,租房的问题是一个大问题,就自己爬取了一些信息,然后就进行了一部分分析。采取的样本并不是特别多。以上只是个人的数据分析与其他无关! 关注技术,学习进步!