【Python】Decision on buying cars COROLLA or LEVIN(数据分析技术实现过程之·1数据清洗)

# 导入必备常用模块
import pandas as pd
import numpy as np
# 读取源数据——卡罗拉口碑
corolla1=pd.read_csv("D:\\2018_BigData\\Python\\Projects_Entry\\Decision on buying cars COROLLA or LEVIN\\2019-3-28-corolla-source.csv",encoding="ANSI")
corolla1.head(2)
# 此处需指定encoding="ANSI",不然默认utf-8g格式会报错。
# 先展现前两行看看字段,不然全展示会干扰字段筛选。
标题缩略图链接btnbtn1btn-orange头像name-text车型购买地点购车经销商...性价比购买车型fn-left口碑支持人数浏览人数评论数img-cont购车目的1认证的车购车目的2
0NaNNaN发表口碑发表口碑发表口碑,发表口碑,发表口碑NaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
12019-01-13 发表了口碑\n ...https://k.autohome.com.cn/526/10987/?medalType...查看全部内容评论(29)评论(29)https://x.autoimg.cn/space/images/head_50X50.gif八号零陈2018款 双擎 1.8L E-CVT智尚版北京北京中业丰田...4.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>https://k.autohome.com.cn/detail/view_01d12t2e...有36人支持该口碑有82222人看过评论(29)https://x.autoimg.cn/k/front/images/con_no.jpg购物NaN接送小孩

2 rows × 33 columns

# 删除多余列
corolla2=corolla1.drop(["标题","缩略图链接","缩略图","btn1","btn","btn-orange","头像","认证的车","fn-left","img-cont"],axis=1)
corolla2.head(3)
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间动力...text-cont外观内饰性价比购买车型口碑支持人数浏览人数评论数购车目的1购车目的2
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
1八号零陈2018款 双擎 1.8L E-CVT智尚版北京北京中业丰田2018年12月14.18?万元2500?公里2019-01-134.03.0...【最满意的一点】乘坐空间 皮质座椅 灯光 外观【最不满意的一点】隔音 高速上风燥明显【空间】...4.04.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有36人支持该口碑有82222人看过评论(29)购物接送小孩
2辛亦2018款 1.2T S-CVT GL智享版泉州泉州宾联#2019年1月11.28?万元4361?公里2019-03-254.03.0...【最满意的一点】1、油耗 油耗对比以前开过的福克斯、凯越、艾瑞泽、XRV等来说还是非常有优势...3.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有9570人看过评论(9)接送小孩NaN

3 rows × 23 columns

corolla2.info() #查看此表信息
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 432 entries, 0 to 431
Data columns (total 23 columns):
name-text    405 non-null object
车型           405 non-null object
购买地点         404 non-null object
购车经销商        396 non-null object
购买时间         405 non-null object
裸车购买价        405 non-null object
目前行驶         372 non-null object
发表时间         405 non-null object
空间           405 non-null float64
动力           405 non-null float64
操控           405 non-null float64
油耗           405 non-null float64
舒适性          405 non-null float64
text-cont    405 non-null object
外观           405 non-null float64
内饰           405 non-null float64
性价比          405 non-null float64
购买车型         405 non-null object
口碑支持人数       405 non-null object
浏览人数         405 non-null object
评论数          405 non-null object
购车目的1        275 non-null object
购车目的2        193 non-null object
dtypes: float64(8), object(15)
memory usage: 77.7+ KB
corolla2.describe() 
# 继续查看此表信息
# 粗略看此表,总共有405条数据,mean和std,min可做进一步分析。
空间动力操控油耗舒适性外观内饰性价比
count405.000000405.000000405.000000405.000000405.000000405.000000405.000000405.000000
mean4.8123464.6172844.6592594.7777784.4864204.7432104.1234574.738272
std0.4329790.6207610.6113160.5495270.6986110.5248620.8322510.605782
min2.0000001.0000001.0000001.0000001.0000002.0000001.0000001.000000
25%5.0000004.0000004.0000005.0000004.0000005.0000004.0000005.000000
50%5.0000005.0000005.0000005.0000005.0000005.0000004.0000005.000000
75%5.0000005.0000005.0000005.0000005.0000005.0000005.0000005.000000
max5.0000005.0000005.0000005.0000005.0000005.0000005.0000005.000000
corolla2.isnull().all()
# 获取全部为缺失值NA的列
# 发现没有这样的列——故,可以下一步。如果有,那就删除。
name-text    False
车型           False
购买地点         False
购车经销商        False
购买时间         False
裸车购买价        False
目前行驶         False
发表时间         False
空间           False
动力           False
操控           False
油耗           False
舒适性          False
text-cont    False
外观           False
内饰           False
性价比          False
购买车型         False
口碑支持人数       False
浏览人数         False
评论数          False
购车目的1        False
购车目的2        False
dtype: bool
corolla2.isnull().any()
# 获取含有缺失值的列
# 发现所有列都有缺失值——不能直接删除列,待会儿要找方法替换或赋值。
# 那接下来看看缺失行
name-text    True
车型           True
购买地点         True
购车经销商        True
购买时间         True
裸车购买价        True
目前行驶         True
发表时间         True
空间           True
动力           True
操控           True
油耗           True
舒适性          True
text-cont    True
外观           True
内饰           True
性价比          True
购买车型         True
口碑支持人数       True
浏览人数         True
评论数          True
购车目的1        True
购车目的2        True
dtype: bool
corolla2.isnull() 
#查看所有缺失值
# 发现有全为NA的行。那等会儿要找办法删掉这些干扰的行。
# 同时,这个形式查看所有缺失值太多太乱,我们需要其显示实际值,方便阅览。下面来搞一波。
# ——因数据量太大,得到下一步分析思路后,已清除这一步展示。
# 用values==True
corolla2[corolla2.isnull().values==True]
# 好像好多缺失值缺失行。。。
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间动力...text-cont外观内饰性价比购买车型口碑支持人数浏览人数评论数购车目的1购车目的2
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
2辛亦2018款 1.2T S-CVT GL智享版泉州泉州宾联#2019年1月11.28?万元4361?公里2019-03-254.03.0...【最满意的一点】1、油耗 油耗对比以前开过的福克斯、凯越、艾瑞泽、XRV等来说还是非常有优势...3.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有9570人看过评论(9)接送小孩NaN
4Hy_Bird2018款 双擎 1.8L E-CVT智尚版沈阳沈阳铁西华通2019年1月14.18?万元1350?公里2019-03-153.04.0...【最满意的一点】行驶平顺,动力无缝切换,被丰田的这套混动系统折服,而且省油这个附加值物超所值...4.03.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有8人支持该口碑有5423人看过评论(4)自驾游NaN
7an2m9wtr82018款 1.2T S-CVT GL智享版宁波宁波宁兴丰田2019年1月11.00?万元3000?公里2019-03-095.03.0...【最满意的一点】卡罗拉作为全球销量冠军车型,都说它口碑好,保值率高,高品质。我买卡罗拉冲的就...4.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有18人支持该口碑有24257人看过评论(8)NaNNaN
7an2m9wtr82018款 1.2T S-CVT GL智享版宁波宁波宁兴丰田2019年1月11.00?万元3000?公里2019-03-095.03.0...【最满意的一点】卡罗拉作为全球销量冠军车型,都说它口碑好,保值率高,高品质。我买卡罗拉冲的就...4.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有18人支持该口碑有24257人看过评论(8)NaNNaN
9买车套路深我要回农村2018款 1.2T S-CVT GL-i智辉版宁波宁波中升丰田江北万达店2018年10月11.78?万元1899?公里2019-02-065.05.0...【最满意的一点】相对省油省心,没什么大问题。无钥匙进入,一键启动挺方便【最不满意的一点】和同...4.04.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有47人支持该口碑有79981人看过评论(43)NaNNaN
9买车套路深我要回农村2018款 1.2T S-CVT GL-i智辉版宁波宁波中升丰田江北万达店2018年10月11.78?万元1899?公里2019-02-065.05.0...【最满意的一点】相对省油省心,没什么大问题。无钥匙进入,一键启动挺方便【最不满意的一点】和同...4.04.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有47人支持该口碑有79981人看过评论(43)NaNNaN
10YY殇夏2018款 1.2T S-CVT GL-i智辉版绍兴嵊州中升丰田2018年9月12.88?万元14554?公里2018-11-295.05.0...【最满意的一点】无钥匙进入【最不满意的一点】没有倒车雷达,没有反光镜自动折叠,连手动折叠按钮...5.03.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有55人支持该口碑有110259人看过评论(70)NaNNaN
..................................................................
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
417axf68dtg42018款 1.2T S-CVT GL智享版北京北京凯百隆昌平分店#2018年8月11.00?万元150?公里2018-08-295.04.0...【最满意的一点】空间比较满意,后排两个大人一个小孩子并不挤。【最不满意的一点】风阻大的脑子涨...5.04.04.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有3722人看过评论(0)跑长途NaN
418永宁庄车神2018款 双擎 1.8L E-CVT智尚版西安西安盛成汇和#2018年5月14.50?万元4600?公里2018-08-274.04.0...【最满意的一点】我就不说是省油!我就要说是科技感!爱谁谁!【最不满意的一点】能量回收系统让收...4.05.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有0人支持该口碑有913人看过评论(1)NaNNaN
418永宁庄车神2018款 双擎 1.8L E-CVT智尚版西安西安盛成汇和#2018年5月14.50?万元4600?公里2018-08-274.04.0...【最满意的一点】我就不说是省油!我就要说是科技感!爱谁谁!【最不满意的一点】能量回收系统让收...4.05.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有0人支持该口碑有913人看过评论(1)NaNNaN
419XCY35612018款 双擎 1.8L E-CVT智尚版大连大连北站中升丰田2018年5月13.60?万元900?公里2018-08-184.05.0...【最满意的一点】最满意的就是油耗 ,平常在城市开 油耗很低 很满意。动力也很充沛,急加速有推...5.05.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有0人支持该口碑有1142人看过评论(5)自驾游NaN
420革命二二二2018款 1.2T S-CVT GL-i智辉版大连大连北站中升丰田2018年6月12.68?万元2000?公里2018-08-185.04.0...【最满意的一点】省油空间大,动力足,价格便宜,实惠【最不满意的一点】无【空间】空间:宽敞【动...5.05.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有4人支持该口碑有896人看过评论(1)NaNNaN
420革命二二二2018款 1.2T S-CVT GL-i智辉版大连大连北站中升丰田2018年6月12.68?万元2000?公里2018-08-185.04.0...【最满意的一点】省油空间大,动力足,价格便宜,实惠【最不满意的一点】无【空间】空间:宽敞【动...5.05.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有4人支持该口碑有896人看过评论(1)NaNNaN
421比砖红的男人2018款 1.2T S-CVT GL智享版武汉武汉中南丰田4S店2018年8月10.68?万元10?公里2018-08-105.04.0...【最满意的一点】油耗,操控【最不满意的一点】织物座椅,配置太低【空间】空间:后排空间确实大,...3.02.04.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有1人支持该口碑有979人看过评论(0)自驾游NaN
422桂昌承2018款 1.2T S-CVT GL智享版重庆百事达丰田2018年7月11.68?万元NaN2018-08-054.04.0...【最满意的一点】操控可以,舒适度满高【最不满意的一点】停起技术真心不管用,基本上没用,开到了...4.04.03.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有2321人看过评论(0)NaNNaN
422桂昌承2018款 1.2T S-CVT GL智享版重庆百事达丰田2018年7月11.68?万元NaN2018-08-054.04.0...【最满意的一点】操控可以,舒适度满高【最不满意的一点】停起技术真心不管用,基本上没用,开到了...4.04.03.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有2321人看过评论(0)NaNNaN
422桂昌承2018款 1.2T S-CVT GL智享版重庆百事达丰田2018年7月11.68?万元NaN2018-08-054.04.0...【最满意的一点】操控可以,舒适度满高【最不满意的一点】停起技术真心不管用,基本上没用,开到了...4.04.03.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有2321人看过评论(0)NaNNaN
423周姐卡罗拉2018款 1.2T S-CVT GL智享版长沙长沙申湘丰田2018年6月11.00?万元2500?公里2018-07-305.05.0...【最满意的一点】操控舒服,各方面均衡【最不满意的一点】要是悬挂臂振改良更好【空间】空间:乘坐...5.05.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有3人支持该口碑有1585人看过评论(5)NaNNaN
423周姐卡罗拉2018款 1.2T S-CVT GL智享版长沙长沙申湘丰田2018年6月11.00?万元2500?公里2018-07-305.05.0...【最满意的一点】操控舒服,各方面均衡【最不满意的一点】要是悬挂臂振改良更好【空间】空间:乘坐...5.05.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有3人支持该口碑有1585人看过评论(5)NaNNaN
424蛮蛮大哥2018款 1.2T S-CVT GL-i智辉版南宁南宁中达丰田2018年5月13.08?万元1800?公里2018-07-265.04.0...【最满意的一点】省心耐操【最不满意的一点】隔音差【空间】空间:A级车中这也是前三了【动力】动...5.04.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有5人支持该口碑有8649人看过评论(3)自驾游NaN
425_花开划落2018款 双擎 1.8L E-CVT智尚版海口海口中升丰田2018年3月15.28?万元NaN2018-06-275.05.0...【最满意的一点】油电混合,省油想开去哪就去哪。车子的操控好,车子的方向盘十分的精准,转向也是...5.03.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有1人支持该口碑有3322人看过评论(1)接送小孩自驾游
426巫巫巫巫2018款 1.2T S-CVT GL-i智辉版成都成都安利捷丰田2018年6月12.58?万元2000?公里2018-06-275.05.0...【最满意的一点】空间宽敞,尤其后排【最不满意的一点】内饰一般但还是将就【空间】空间:三人坐都...3.01.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有1人支持该口碑有2944人看过评论(3)NaNNaN
426巫巫巫巫2018款 1.2T S-CVT GL-i智辉版成都成都安利捷丰田2018年6月12.58?万元2000?公里2018-06-275.05.0...【最满意的一点】空间宽敞,尤其后排【最不满意的一点】内饰一般但还是将就【空间】空间:三人坐都...3.01.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有1人支持该口碑有2944人看过评论(3)NaNNaN
429cllhtt2018款 1.2T S-CVT GL智享版哈尔滨哈尔滨龙晟丰田2018年5月10.98?万元1560?公里2018-06-095.05.0...【最满意的一点】像标题所说的油耗超级低,对于我这个省钱控来说,太适合我了【最不满意的一点】过...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有8594人看过评论(2)NaNNaN
429cllhtt2018款 1.2T S-CVT GL智享版哈尔滨哈尔滨龙晟丰田2018年5月10.98?万元1560?公里2018-06-095.05.0...【最满意的一点】像标题所说的油耗超级低,对于我这个省钱控来说,太适合我了【最不满意的一点】过...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有8594人看过评论(2)NaNNaN
430淡定的小老虎不咬人2018款 1.2T S-CVT GL-i智辉版东莞大朗永佳丰田2018年4月11.98?万元3500?公里2018-06-045.05.0...【最满意的一点】油耗舒适还不错【最不满意的一点】就是不知道哪里有时候有响,但是找不出来【空间...5.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有9人支持该口碑有16200人看过评论(36)NaNNaN
430淡定的小老虎不咬人2018款 1.2T S-CVT GL-i智辉版东莞大朗永佳丰田2018年4月11.98?万元3500?公里2018-06-045.05.0...【最满意的一点】油耗舒适还不错【最不满意的一点】就是不知道哪里有时候有响,但是找不出来【空间...5.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有9人支持该口碑有16200人看过评论(36)NaNNaN
431Smilence_Li2018款 1.2T S-CVT GL-i智辉版眉山眉山弘吉丰田2018年4月12.60?万元1000?公里2018-05-024.04.0...【最满意的一点】省油省油太省油了,跟家里另外一辆途观10个油比起来简直不要太省,就是为什么刚...4.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有36人支持该口碑有38939人看过评论(14)NaNNaN
431Smilence_Li2018款 1.2T S-CVT GL-i智辉版眉山眉山弘吉丰田2018年4月12.60?万元1000?公里2018-05-024.04.0...【最满意的一点】省油省油太省油了,跟家里另外一辆途观10个油比起来简直不要太省,就是为什么刚...4.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有36人支持该口碑有38939人看过评论(14)NaNNaN

1006 rows × 23 columns

# 查找存在缺失值的行——原来是any后面默认空值是查看列空值,加个数字1就是查看行空值,get到了。
corolla2.isnull().any(1)
0       True
1      False
2       True
3      False
4       True
5      False
6      False
7       True
8      False
9       True
10      True
11     False
12     False
13      True
14     False
15      True
16      True
17      True
18      True
19      True
20      True
21      True
22      True
23      True
24     False
25     False
26     False
27     False
28     False
29      True
       ...  
402     True
403     True
404     True
405    False
406     True
407    False
408     True
409     True
410    False
411     True
412     True
413    False
414    False
415    False
416     True
417     True
418     True
419     True
420     True
421     True
422     True
423     True
424     True
425     True
426     True
427    False
428    False
429     True
430     True
431     True
Length: 432, dtype: bool
# 用values==True来看实值
corolla2[corolla2.isnull().any(1).values==True]
# 有255行有缺失值,占了总数据量超过一半。有些只是购车用途列缺失,不能贸贸然删除。少部分是整行缺失,可以删除。
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间动力...text-cont外观内饰性价比购买车型口碑支持人数浏览人数评论数购车目的1购车目的2
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
2辛亦2018款 1.2T S-CVT GL智享版泉州泉州宾联#2019年1月11.28?万元4361?公里2019-03-254.03.0...【最满意的一点】1、油耗 油耗对比以前开过的福克斯、凯越、艾瑞泽、XRV等来说还是非常有优势...3.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有9570人看过评论(9)接送小孩NaN
4Hy_Bird2018款 双擎 1.8L E-CVT智尚版沈阳沈阳铁西华通2019年1月14.18?万元1350?公里2019-03-153.04.0...【最满意的一点】行驶平顺,动力无缝切换,被丰田的这套混动系统折服,而且省油这个附加值物超所值...4.03.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有8人支持该口碑有5423人看过评论(4)自驾游NaN
7an2m9wtr82018款 1.2T S-CVT GL智享版宁波宁波宁兴丰田2019年1月11.00?万元3000?公里2019-03-095.03.0...【最满意的一点】卡罗拉作为全球销量冠军车型,都说它口碑好,保值率高,高品质。我买卡罗拉冲的就...4.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有18人支持该口碑有24257人看过评论(8)NaNNaN
9买车套路深我要回农村2018款 1.2T S-CVT GL-i智辉版宁波宁波中升丰田江北万达店2018年10月11.78?万元1899?公里2019-02-065.05.0...【最满意的一点】相对省油省心,没什么大问题。无钥匙进入,一键启动挺方便【最不满意的一点】和同...4.04.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有47人支持该口碑有79981人看过评论(43)NaNNaN
10YY殇夏2018款 1.2T S-CVT GL-i智辉版绍兴嵊州中升丰田2018年9月12.88?万元14554?公里2018-11-295.05.0...【最满意的一点】无钥匙进入【最不满意的一点】没有倒车雷达,没有反光镜自动折叠,连手动折叠按钮...5.03.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有55人支持该口碑有110259人看过评论(70)NaNNaN
13yugi312018款 1.2T S-CVT GL智享版北京凯百隆丰田2018年12月10.70?万元1000?公里2018-12-304.04.0...【最满意的一点】现代社会,车已然不是代步工具,不是遮风挡雨的移动帐篷,更是一种身份的象征,出...5.04.03.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有41人支持该口碑有128149人看过评论(71)NaNNaN
15sprone2018款 双擎 1.8L E-CVT智尚版长沙长沙华运通2018年5月14.98?万元5700?公里2018-12-184.05.0...【最满意的一点】油耗低,动力够用,行驶过程中基本感受不到顿挫。最智能的自动启停简直不要太爽。...5.05.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有45人支持该口碑有53458人看过评论(21)自驾游NaN
16NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
17沈海龙粑粑2018款 1.2T S-CVT GL智享版长春长春华阳丰田2018年8月10.98?万元2800?公里2018-12-114.03.0...【最满意的一点】1.媳妇喜欢2.保值率3.空间4.油耗5.维修保养便宜(满意程度依次递减)【...3.03.04.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有59人支持该口碑有94487人看过评论(39)NaNNaN
18任明星4182018款 双擎 1.8L E-CVT智尚版上海上海永达丰田2018年9月14.28?万元6400?公里2018-12-015.04.0...【最满意的一点】最满意,第一绝对是油耗,这个没得说;第二是电动模式下的安静,第三就是人性化的...4.05.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有62人支持该口碑有77980人看过评论(23)NaNNaN
19修养之道一脉相承2018款 1.2T S-CVT GL-i智辉版濮阳濮阳世纪丰田2018年6月12.70?万元7903?公里2018-06-105.04.0...【最满意的一点】油耗和舒适度以及日后省心度是我选择卡罗拉的主要原因,相对省油,舒适度也不错,...5.03.02.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有213人支持该口碑有465475人看过评论(132)NaNNaN
20瓦坎达6782018款 双擎 1.8L E-CVT智尚版威海威海大友丰田2018年11月14.78?万元156?公里2018-11-255.04.0...【最满意的一点】油耗,丰田的技术靠谱的混动,油耗可以说没有对手了吧?【最不满意的一点】配置只...5.04.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有18人支持该口碑有42441人看过评论(29)NaNNaN
21dingyaping7112018款 1.2T S-CVT GL-i智辉版惠州惠州展通丰田2018年4月12.38?万元5000?公里2018-04-295.05.0...【最满意的一点】空间大,led灯晚上很亮,外观大气。【最不满意的一点】点烟器好像只有一个.u...5.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有359人支持该口碑有536372人看过评论(368)NaNNaN
22yesirblue2018款 1.2T S-CVT GL-i智辉版广州NaN2018年10月13.66?万元500?公里2018-11-155.05.0...【最满意的一点】满意的地方有几个:一是良好的口碑。买车之前上卡罗拉论坛看除了说智辉版大灯问题...4.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有57人支持该口碑有63942人看过评论(17)上下班NaN
23胜利飞鹰2018款 双擎 1.8L E-CVT智尚版合肥合肥恒信丰田2018年7月14.38?万元10500?公里2018-11-155.05.0...【最满意的一点】人生第一辆车,最满意就是混动的平顺性,科技改变生活,科技服务着生活,能将油电...5.03.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有22人支持该口碑有43860人看过评论(21)自驾游NaN
29自由选择12018款 双擎 1.8L E-CVT智尚版南宁南宁天下行丰田2018年6月14.88?万元3884?公里2018-08-183.04.0...【最满意的一点】低速汽油机不启动很安静,舒服,刚开的时候车启动没启动都分不出来。舒适度真的不...3.03.03.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有42人支持该口碑有89201人看过评论(31)NaNNaN
30Coolio2018款 双擎 1.8L E-CVT智尚版汕头汕头合众丰田2018年4月15.08?万元3050?公里2018-06-085.03.0...【最满意的一点】无钥匙进入功能挺方便的,而且配有卡片钥匙,大灯远近光LED,日行灯LED,雾...5.03.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有178人支持该口碑有480176人看过评论(218)NaNNaN
31浪子韩柏2018款 双擎 1.8L E-CVT智尚版杭州杭州金丰临安分公司#2018年7月14.48?万元300?公里2018-07-215.04.0...【最满意的一点】后排中间地台是平整的,坐三人很舒服,适合我这个五口之家。起步用电,安静。等红...4.04.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有40人支持该口碑有90003人看过评论(39)NaNNaN
32NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
3587年的小威驰2018款 1.2T S-CVT GL智享版泉州泉州大长江丰田2018年4月11.98?万元NaN2018-05-165.04.0...【最满意的一点】比较喜欢小卡的操控性,非常的轻便灵敏,还有它的空调制冷系统,5月份的南方已经...5.05.03.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有100人支持该口碑有205202人看过评论(76)自驾游跑长途
37JackLee2162018款 1.2T S-CVT GL-i智辉版佛山佛山骏安丰田2018年4月12.70?万元NaN2018-04-225.04.0...【最满意的一点】空间肯定是最满意的一点,尤其后排空间是我所知道的A级车里面最宽敞的,后排地板...4.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有213人支持该口碑有214477人看过评论(104)接送小孩NaN
38特工某某2018款 1.2T S-CVT GL智享版西安西安道恩丰田2018年12月11.28?万元NaN2019-03-285.04.0...【最满意的一点】空间非常不错, 我和我女朋友都很满意 , 尤其后排空间, 可以放很多东西。【...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有43人看过评论(0)NaNNaN
39耿笑天2018款 1.2T S-CVT GL-i智辉版西安西安道恩丰田2019年1月14.00?万元2500?公里2019-03-245.04.0...【最满意的一点】省油,日系车性能比较稳定,空间比较宽敞,作为家庭车不错【最不满意的一点】车漆...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有0人支持该口碑有513人看过评论(0)NaNNaN
41暖心的欧巴2018款 1.2T S-CVT GL-i智辉版无锡宜兴新苏南丰田2019年3月12.48?万元150?公里2019-03-135.04.0...【最满意的一点】外形设计比较细腻,LED大灯比较拉风,尤其是夜间驾驶感受比卤素完全上了一个档...5.04.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有3人支持该口碑有3453人看过评论(0)接送小孩NaN
45小卡卡k2018款 1.2T S-CVT GL智享版北海北海易达#2019年1月11.28?万元500?公里2019-02-075.05.0...【最满意的一点】油耗比较小,空间也够大,利用率高,还有就是无钥匙进入系统也比较省事,总得来说...5.02.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有8人支持该口碑有8690人看过评论(26)NaNNaN
47被驯服的考拉2018款 双擎 1.8L E-CVT智尚版宿迁沭阳联众丰田2018年12月14.68?万元800?公里2019-01-224.03.0...【最满意的一点】油耗。朋友的SUV正常13-14个油。我是新司机,油耗现在在4.5-5.0之...3.03.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有2人支持该口碑有4518人看过评论(9)NaNNaN
48NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
49卡罗拉智辉车主2018款 1.2T S-CVT GL-i智辉版牡丹江牡丹江名派丰田2018年8月12.18?万元3700?公里2019-01-035.04.0...【最满意的一点】很满意颜值和整车的调教【最不满意的一点】车漆和玻璃有点薄,第一次坐进去看不了...5.03.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有4人支持该口碑有6979人看过评论(4)NaNNaN
51洋葱LLLLLL2018款 1.2T S-CVT GL智享版福州福州玖玖丰田2018年9月10.38?万元3340?公里2018-09-285.04.0...【最满意的一点】省油 省心 无钥匙进入 一键启动【最不满意的一点】低配没有led大灯 日行灯...4.05.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有41人支持该口碑有51531人看过评论(65)NaNNaN
..................................................................
392买什么车好zcx2018款 1.2T S-CVT GL智享版广州芳村永佳丰田2018年7月11.30?万元3200?公里2018-08-213.03.0...【最满意的一点】外观啦,好犀利,觉得中意【最不满意的一点】味道重,新车可能不太省油,得过磨合...4.03.03.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有1人支持该口碑有3389人看过评论(6)接送小孩NaN
393某人17352018款 1.2T S-CVT GL智享版威海威海大友丰田2018年10月11.18?万元500?公里2018-11-085.04.0...【最满意的一点】外观好看,相信丰田的质量!【最不满意的一点】开了半个月了,基本没有大毛病,就...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有473人看过评论(0)NaNNaN
394Hannah_Han2018款 1.2T S-CVT GL智享版威海威海大友丰田2018年10月12.00?万元736?公里2018-11-085.04.0...【最满意的一点】操作便捷 很适合新手 反应迅速 内饰也不错 低调黑【最不满意的一点】功能不是...4.05.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有759人看过评论(0)NaNNaN
395邓邓邓邓_hh12242018款 1.2T S-CVT GL智享版昌吉昌吉庞大丰雅丰田2018年9月11.00?万元2155?公里2018-11-045.05.0...【最满意的一点】油耗真心不错 市区7.8左右【最不满意的一点】车内空间有点小 后排不够宽敞【...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有188人看过评论(0)NaNNaN
396拉拉手刹打个方向2018款 1.2T S-CVT GL智享版南宁长久博丰丰田2018年10月11.40?万元1200?公里2018-10-305.05.0...【最满意的一点】油耗满意,6.3个油很满意【最不满意的一点】储物空间小了一点,放不了什么【空...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有1人支持该口碑有637人看过评论(0)NaNNaN
398Chaplin62018款 1.2T S-CVT GL智享版郑州巩义裕华丰田2018年9月11.08?万元NaN2018-10-295.01.0...【最满意的一点】油耗小,空间大【最不满意的一点】1.仪表盘高,座位低,看不到引擎盖2.加速性...3.03.04.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有529人看过评论(0)接送小孩购物
400NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
401哼哈s2018款 1.2T S-CVT GL智享版郑州郑州世纪丰田2018年3月11.28?万元869?公里2018-10-265.05.0...【最满意的一点】油耗非常令人满意 车里的空间足够日常使用【最不满意的一点】跑起来有声音,不过...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有541人看过评论(0)购物NaN
402yxg199009212018款 1.2T S-CVT GL-i智辉版天水天水天合华通丰田2018年10月13.00?万元1000?公里2018-10-265.05.0...【最满意的一点】舒适度和操控吧应该是【最不满意的一点】油耗比预想的稍微有点大【空间】空间:轿...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有0人支持该口碑有514人看过评论(0)NaNNaN
403哈喽小卡2018款 1.2T S-CVT GL-i智辉版郑州郑州世纪丰田2018年10月12.08?万元800?公里2018-10-245.05.0...【最满意的一点】性价比高,省油【最不满意的一点】内饰不上档次,胎噪稍微有点大【空间】空间:空...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有1人支持该口碑有483人看过评论(1)NaNNaN
404qwertcvb2018款 1.2T S-CVT GL-i智辉版武威武威金色丰田2018年8月12.78?万元1000?公里2018-10-245.05.0...【最满意的一点】品牌力,丰田说起历史悠久,在中国市场上有良好的口碑,众人推崇肯定是有一定道理...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有0人支持该口碑有196人看过评论(0)接送小孩NaN
406阿迪快跑2018款 1.2T S-CVT GL-i智辉版蚌埠蚌埠润业丰田2018年8月11.88?万元2200?公里2018-10-135.05.0...【最满意的一点】裸车118800 精品 5000 手续费 3500。空间挺大的,后排踏脚基本...5.05.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有3人支持该口碑有2220人看过评论(5)NaNNaN
408尺度大侠范2018款 双擎 1.8L E-CVT智尚版苏州昆山昆嘉一汽丰田2018年6月15.28?万元4000?公里2018-10-105.05.0...【最满意的一点】白色的外观,精致,大气,又时尚,咱就是个俗人,红色太闷骚,黑色太暗沉,还不如...5.04.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有1人支持该口碑有999人看过评论(2)NaNNaN
409不如一默丶2018款 1.2T S-CVT GL-i智辉版青岛青岛安利捷丰田重庆路店2018年9月12.13?万元2160?公里2018-10-095.05.0...【最满意的一点】省心,外观漂亮【最不满意的一点】没有自带胎压监测,老感觉轮胎气压不稳【空间】...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有0人支持该口碑有962人看过评论(1)NaNNaN
411九玖99242018款 1.2T S-CVT GL智享版盘锦盘锦利星丰田汽车2018年9月10.78?万元NaN2018-09-285.04.0...【最满意的一点】车空间很大,油耗低。很适合代步。在同等级别车中很优秀了。【最不满意的一点】车...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有1139人看过评论(1)购物接送小孩
412桐城新农合张昭2018款 1.2T S-CVT GL-i智辉版西安西安航天龙腾2018年6月12.38?万元2300?公里2018-09-285.05.0...【最满意的一点】性价比高,还挺省油,家用最实在了。【最不满意的一点】内饰塑料太多了,新车味道...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有0人支持该口碑有858人看过评论(0)NaNNaN
416NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
417axf68dtg42018款 1.2T S-CVT GL智享版北京北京凯百隆昌平分店#2018年8月11.00?万元150?公里2018-08-295.04.0...【最满意的一点】空间比较满意,后排两个大人一个小孩子并不挤。【最不满意的一点】风阻大的脑子涨...5.04.04.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有3722人看过评论(0)跑长途NaN
418永宁庄车神2018款 双擎 1.8L E-CVT智尚版西安西安盛成汇和#2018年5月14.50?万元4600?公里2018-08-274.04.0...【最满意的一点】我就不说是省油!我就要说是科技感!爱谁谁!【最不满意的一点】能量回收系统让收...4.05.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有0人支持该口碑有913人看过评论(1)NaNNaN
419XCY35612018款 双擎 1.8L E-CVT智尚版大连大连北站中升丰田2018年5月13.60?万元900?公里2018-08-184.05.0...【最满意的一点】最满意的就是油耗 ,平常在城市开 油耗很低 很满意。动力也很充沛,急加速有推...5.05.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有0人支持该口碑有1142人看过评论(5)自驾游NaN
420革命二二二2018款 1.2T S-CVT GL-i智辉版大连大连北站中升丰田2018年6月12.68?万元2000?公里2018-08-185.04.0...【最满意的一点】省油空间大,动力足,价格便宜,实惠【最不满意的一点】无【空间】空间:宽敞【动...5.05.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有4人支持该口碑有896人看过评论(1)NaNNaN
421比砖红的男人2018款 1.2T S-CVT GL智享版武汉武汉中南丰田4S店2018年8月10.68?万元10?公里2018-08-105.04.0...【最满意的一点】油耗,操控【最不满意的一点】织物座椅,配置太低【空间】空间:后排空间确实大,...3.02.04.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有1人支持该口碑有979人看过评论(0)自驾游NaN
422桂昌承2018款 1.2T S-CVT GL智享版重庆百事达丰田2018年7月11.68?万元NaN2018-08-054.04.0...【最满意的一点】操控可以,舒适度满高【最不满意的一点】停起技术真心不管用,基本上没用,开到了...4.04.03.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有0人支持该口碑有2321人看过评论(0)NaNNaN
423周姐卡罗拉2018款 1.2T S-CVT GL智享版长沙长沙申湘丰田2018年6月11.00?万元2500?公里2018-07-305.05.0...【最满意的一点】操控舒服,各方面均衡【最不满意的一点】要是悬挂臂振改良更好【空间】空间:乘坐...5.05.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有3人支持该口碑有1585人看过评论(5)NaNNaN
424蛮蛮大哥2018款 1.2T S-CVT GL-i智辉版南宁南宁中达丰田2018年5月13.08?万元1800?公里2018-07-265.04.0...【最满意的一点】省心耐操【最不满意的一点】隔音差【空间】空间:A级车中这也是前三了【动力】动...5.04.04.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有5人支持该口碑有8649人看过评论(3)自驾游NaN
425_花开划落2018款 双擎 1.8L E-CVT智尚版海口海口中升丰田2018年3月15.28?万元NaN2018-06-275.05.0...【最满意的一点】油电混合,省油想开去哪就去哪。车子的操控好,车子的方向盘十分的精准,转向也是...5.03.05.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有1人支持该口碑有3322人看过评论(1)接送小孩自驾游
426巫巫巫巫2018款 1.2T S-CVT GL-i智辉版成都成都安利捷丰田2018年6月12.58?万元2000?公里2018-06-275.05.0...【最满意的一点】空间宽敞,尤其后排【最不满意的一点】内饰一般但还是将就【空间】空间:三人坐都...3.01.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有1人支持该口碑有2944人看过评论(3)NaNNaN
429cllhtt2018款 1.2T S-CVT GL智享版哈尔滨哈尔滨龙晟丰田2018年5月10.98?万元1560?公里2018-06-095.05.0...【最满意的一点】像标题所说的油耗超级低,对于我这个省钱控来说,太适合我了【最不满意的一点】过...5.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有8594人看过评论(2)NaNNaN
430淡定的小老虎不咬人2018款 1.2T S-CVT GL-i智辉版东莞大朗永佳丰田2018年4月11.98?万元3500?公里2018-06-045.05.0...【最满意的一点】油耗舒适还不错【最不满意的一点】就是不知道哪里有时候有响,但是找不出来【空间...5.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有9人支持该口碑有16200人看过评论(36)NaNNaN
431Smilence_Li2018款 1.2T S-CVT GL-i智辉版眉山眉山弘吉丰田2018年4月12.60?万元1000?公里2018-05-024.04.0...【最满意的一点】省油省油太省油了,跟家里另外一辆途观10个油比起来简直不要太省,就是为什么刚...4.03.05.0卡罗拉 2018款 1.2T S-CVT GL-i智辉版?>>有36人支持该口碑有38939人看过评论(14)NaNNaN

255 rows × 23 columns

na_line=corolla2.isnull().all(1)
# 获取全部为缺失值NA的行
na_line.sum()
# 统计有多少行全部缺失值——发现有27行,可删除。
27
# 好了可以开始缺失值处理了。
# 对于完全缺失的行,这里直接删除,对于部分缺失行,则进行填充。
corolla2.shape   #先看看总数据量
(432, 23)
# 删除完全缺失的行,若不指定参数how,则删除的是所有含有nan的行
corolla3=corolla2.dropna(how='all')
corolla3.shape
# 删除后,数据量从432行减少到405行,刚好是删除了27行全部为缺失值的行。
(405, 23)
# 对部分缺失行进行填充
# 这里采用先后两种填充方式:①针对数值型数据采用sklearn均值替换,②随后针对其他类型数值采用“后一行的值填充前一行的缺失值”
# ①利用sklearn替换缺失值。当缺失值为数值型数据时,可用利用均值来替换。
from sklearn.preprocessing import Imputer
imr=Imputer(missing_values="NaN",strategy="mean",axis=0)   # 按照行均值替换对应缺失值
imr=imr.fit(corolla3.values)
imputed_data=pd.DataFrame(imr.transform(corolla3.values))
# 或,以上两个语句,可以合并为:imputed_data=imr,fit_transform(corolla3)
print(imputed_data)

# 运行报错: ValueError: could not convert string to float: '八号零陈'
# 开始查错,然后在这个帖子找到了解决方法。https://blog.csdn.net/u013408224/article/details/82629033
# 重试,尝试解决 ValueError: could not convert string to float
from sklearn.preprocessing import Imputer
numeric_corolla = corolla3.select_dtypes(exclude=['object'])
imr=Imputer(missing_values="NaN",strategy="mean",axis=0)   # 按照行均值替换对应缺失值
imputed_data=imr.fit_transform(numeric_corolla)
print(imputed_data)

# Imputer类的fit方法:对数据集中的参数进行识别并构建相应的数据补齐模型
# Imputer类的transform方法:使用刚构建的数据补齐模型对数据集中相应参数的缺失值进行补齐。
# 数据补齐需要保持维度相同。
[[4. 3. 4. ... 4. 4. 4.]
 [4. 3. 4. ... 3. 4. 5.]
 [4. 5. 4. ... 4. 1. 4.]
 ...
 [5. 5. 5. ... 5. 4. 5.]
 [5. 5. 5. ... 5. 3. 5.]
 [4. 4. 3. ... 4. 3. 5.]]
# ②用后一行的值填充前一行的缺失值
corolla4=corolla3.fillna(method='backfill')
corolla4.head(5)
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间动力...text-cont外观内饰性价比购买车型口碑支持人数浏览人数评论数购车目的1购车目的2
1八号零陈2018款 双擎 1.8L E-CVT智尚版北京北京中业丰田2018年12月14.18?万元2500?公里2019-01-134.03.0...【最满意的一点】乘坐空间 皮质座椅 灯光 外观【最不满意的一点】隔音 高速上风燥明显【空间】...4.04.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有36人支持该口碑有82222人看过评论(29)购物接送小孩
2辛亦2018款 1.2T S-CVT GL智享版泉州泉州宾联#2019年1月11.28?万元4361?公里2019-03-254.03.0...【最满意的一点】1、油耗 油耗对比以前开过的福克斯、凯越、艾瑞泽、XRV等来说还是非常有优势...3.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有9570人看过评论(9)接送小孩接送小孩
3张某某93902018款 双擎 1.8L E-CVT智尚版郑州郑州裕华丰田2018年9月14.43?万元5339?公里2018-09-134.05.0...【最满意的一点】目前开的比较少,才小500km,要说目前最满意,就是省油和比较安静吧。【最不...4.01.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有101人支持该口碑有200279人看过评论(51)自驾游接送小孩
4Hy_Bird2018款 双擎 1.8L E-CVT智尚版沈阳沈阳铁西华通2019年1月14.18?万元1350?公里2019-03-153.04.0...【最满意的一点】行驶平顺,动力无缝切换,被丰田的这套混动系统折服,而且省油这个附加值物超所值...4.03.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有8人支持该口碑有5423人看过评论(4)自驾游自驾游
5terebi2018款 双擎 1.8L E-CVT智尚版上海上海冠松绅晖丰田2018年12月14.28?万元9000?公里2019-03-145.04.0...【最满意的一点】油耗低于同类型燃油车。空间也还不错,尤其后排地板纯平,也是当时首选丰田的重要...5.05.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有17人支持该口碑有11511人看过评论(6)购物自驾游

5 rows × 23 columns

# 接下来导入雷凌口碑数据,走上述同等步骤,完成数据清理和缺失值填充。
# 读取源数据——雷凌口碑
levin1=pd.read_csv("D:\\2018_BigData\\Python\\Projects_Entry\\Decision on buying cars COROLLA or LEVIN\\2019-3-28-levin-source.csv",encoding="ANSI")
levin1.head(2)
标题缩略图链接btnbtn1btn-orange头像name-text车型购买地点购车经销商...口碑支持人数浏览人数评论数购车目的2img-cont购车目的3认证的车img-cont1购车目的4img-cont2
0NaNNaN发表口碑发表口碑发表口碑,发表口碑,发表口碑,发表口碑NaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
12018-11-29 发表了口碑\n ...https://k.autohome.com.cn/3462/11040/?medalTyp...查看全部内容评论(25)评论(25)https://x.autoimg.cn/space/images/head_50X50.gifVOLVO1102018款 双擎 1.8H GS-V CVT尊贵版 国V广州广汽丰田天河店...有26人支持该口碑有47833人看过评论(25)自驾游https://x.autoimg.cn/k/front/images/con_no.jpgNaNNaNhttps://x.autoimg.cn/k/front/images/con_no.jpgNaNhttps://x.autoimg.cn/k/front/images/con_no.jpg

2 rows × 37 columns

# 接下来数据信息查看,数据清理,缺失值处理等,按照前面卡罗拉数据步骤走一遍。
levin2=levin1.drop(["标题","缩略图链接","缩略图","btn1","btn","btn-orange","头像","认证的车","fn-left","img-cont","img-cont1","img-cont2"],axis=1)
levin2.head(3)
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间text-cont...内饰性价比购车目的购买车型口碑支持人数浏览人数评论数购车目的2购车目的3购车目的4
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
1VOLVO1102018款 双擎 1.8H GS-V CVT尊贵版 国V广州广汽丰田天河店2018年11月13.18?万元3300?公里2018-11-294.0【最满意的一点】最满意当然是油耗,还有就是能在广州摇节能号,广州人都知道摇号不是一般的难啊,......3.03.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有26人支持该口碑有47833人看过评论(25)自驾游NaNNaN
2真是张三2018款 185T CVT尊贵版 国V长沙广汽丰田长沙长威中南店2018年10月10.78?万元5600?公里2019-03-275.0【最满意的一点】价格合适,外观时尚,空间还不错,油耗比较低,加速顿挫感小,动力足,操控性好。......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有0人支持该口碑有1738人看过评论(3)接送小孩泡妞NaN

3 rows × 25 columns

levin2.info() #查看此表信息
# 340条记录
# 发现有25列,比corolla多了两列,是因为Levin的用户购买用途有四列,而corolla只有两列。后面看需要与否,再对corolla做列填充。
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 363 entries, 0 to 362
Data columns (total 25 columns):
name-text    340 non-null object
车型           340 non-null object
购买地点         339 non-null object
购车经销商        308 non-null object
购买时间         340 non-null object
裸车购买价        340 non-null object
目前行驶         299 non-null object
发表时间         340 non-null object
空间           340 non-null float64
text-cont    340 non-null object
动力           340 non-null float64
操控           340 non-null float64
油耗           340 non-null float64
舒适性          340 non-null float64
外观           340 non-null float64
内饰           340 non-null float64
性价比          340 non-null float64
购车目的         340 non-null object
购买车型         340 non-null object
口碑支持人数       340 non-null object
浏览人数         340 non-null object
评论数          340 non-null object
购车目的2        272 non-null object
购车目的3        173 non-null object
购车目的4        82 non-null object
dtypes: float64(8), object(17)
memory usage: 71.0+ KB
levin2.describe() #查看此表统计信息,这个含有大量价值。
空间动力操控油耗舒适性外观内饰性价比
count340.000000340.000000340.000000340.000000340.000000340.000000340.000000340.000000
mean4.7794124.5794124.6117654.7294124.3382354.7617654.2441184.805882
std0.4623140.6068830.6162810.5976990.6336270.5028030.7096850.518644
min3.0000003.0000002.0000001.0000002.0000001.0000001.0000002.000000
25%5.0000004.0000004.0000005.0000004.0000005.0000004.0000005.000000
50%5.0000005.0000005.0000005.0000004.0000005.0000004.0000005.000000
75%5.0000005.0000005.0000005.0000005.0000005.0000005.0000005.000000
max5.0000005.0000005.0000005.0000005.0000005.0000005.0000005.000000
# 用values==True来看实值
levin2[levin2.isnull().any(1).values==True]
# 300行有缺失值,不过根据corolla数据类比估计,这里大部分是购车用途那里小缺失而已,只有少部分是整行缺失。
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间text-cont...内饰性价比购车目的购买车型口碑支持人数浏览人数评论数购车目的2购车目的3购车目的4
0NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
1VOLVO1102018款 双擎 1.8H GS-V CVT尊贵版 国V广州广汽丰田天河店2018年11月13.18?万元3300?公里2018-11-294.0【最满意的一点】最满意当然是油耗,还有就是能在广州摇节能号,广州人都知道摇号不是一般的难啊,......3.03.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有26人支持该口碑有47833人看过评论(25)自驾游NaNNaN
2真是张三2018款 185T CVT尊贵版 国V长沙广汽丰田长沙长威中南店2018年10月10.78?万元5600?公里2019-03-275.0【最满意的一点】价格合适,外观时尚,空间还不错,油耗比较低,加速顿挫感小,动力足,操控性好。......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有0人支持该口碑有1738人看过评论(3)接送小孩泡妞NaN
3寻找高营2018款 185T CVT尊贵版 国VI徐州浩邦丰田2019年3月10.88?万元678?公里2019-03-265.0【最满意的一点】对于我这样追求美的年轻人来说,最满意的当然是它的外观了。整个看起来非常的年轻......5.05.0上下班雷凌 2018款 185T CVT尊贵版 国VI?>>有0人支持该口碑有2436人看过评论(1)自驾游NaNNaN
9BXP20102018款 双擎 1.8H GS-V CVT尊贵版 国V济南中升丰悦广丰匡山店2018年12月13.58?万元4500?公里2019-03-225.0【最满意的一点】省油!女司机,冬天最低油耗开到3.7,任性驾驶最费油开到4.8,只上下班开的......4.05.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有6人支持该口碑有5258人看过评论(5)接送小孩跑长途NaN
11沙雕市热心网友2018款 185T CVT尊贵版 国VI惠州惠州惠美昌丰田2019年1月10.40?万元1900?公里2019-03-205.0【最满意的一点】最满意配置高,外观看起来漂亮,省油,空间大,保养省心。【最不满意的一点】最不......5.05.0上下班雷凌 2018款 185T CVT尊贵版 国VI?>>有13人支持该口碑有6844人看过评论(9)自驾游泡妞NaN
12捷哥很会装2018款 185T CVT尊贵版 国V常州广汽丰田广联4S店2019年1月11.38?万元7084?公里2019-03-205.0【最满意的一点】外观好看,干净利落,没有多余的装饰。内部空间很大,别看外部看起来车子不大,但......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有8人支持该口碑有4406人看过评论(16)NaNNaNNaN
14可爱亲心酱2018款 185T CVT尊贵版 国VI丽水丽水广荣汽车2019年2月11.38?万元820?公里2019-03-165.0【最满意的一点】最满意的有两点吧,一是空间,我是作为家用车偶尔也跑滴滴表现不错,我175的个......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国VI?>>有18人支持该口碑有12665人看过评论(1)购物接送小孩NaN
15星星依2018款 185T CVT尊贵版 国V南京南京协众丰田东麒路店2018年12月12.88?万元5900?公里2019-03-155.0【最满意的一点】最满意的地方就是这辆车的动力输出比较平顺,而且驾驶质感比较好,我当初还疑惑为......5.04.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有18人支持该口碑有11001人看过评论(21)购物自驾游NaN
16NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
17傲世男儿2018款 185T CVT尊贵版 国V南京南京大政丰田2019年1月10.92?万元2900?公里2019-03-145.0【最满意的一点】虽然雷凌的车身尺寸并不大,但是车里的空间不局促,对于我这种家用的诉求来说,空......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有11人支持该口碑有8012人看过评论(22)购物自驾游NaN
19快乐的手枪毫2018款 185T CVT尊贵版 国V中山广汽丰田合田店2018年10月10.50?万元5000?公里2019-03-145.0【最满意的一点】外观帅气 空间大和皮座椅。这可不是瞎夸哈,雷凌的外观真的很帅气,家族式的前脸......4.04.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有9人支持该口碑有3290人看过评论(13)NaNNaNNaN
20御剑寄情餐2018款 185T CVT尊贵版 国V中山广汽丰田合田店2018年8月10.80?万元7000?公里2019-03-145.0【最满意的一点】买车到现在已经大半年时间了,平时虽然不常用车,但是它给我的印象还是蛮好的。它......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有11人支持该口碑有4215人看过评论(28)自驾游NaNNaN
23邓雅琴2018款 185T CVT尊贵版 国V杭州杭州丰田全通绍兴路店2018年10月10.83?万元6400?公里2019-03-125.0【最满意的一点】最满意的地方还是雷凌的外观设计比较符合我对车子的要求,我个人觉得它比卡罗拉整......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有14人支持该口碑有6449人看过评论(17)购物NaNNaN
24LesLie白花花_SAY2018款 双擎 1.8H GS-V CVT尊贵版 国VI上海广汽丰田开隆2019年3月14.70?万元106?公里2019-03-124.0【最满意的一点】油耗非常低,第一天开了50几公里已经跌到了6.5百公里油耗,现在106公里已......4.04.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国VI?>>有5人支持该口碑有4136人看过评论(26)自驾游NaNNaN
25毛毛JOY2018款 185T CVT尊贵版 国V南京南京协众丰田东麒路店2019年1月11.38?万元3200?公里2019-03-115.0【最满意的一点】我对丰田雷凌最满意的有两点,首先是这辆车的动力总成配置非常满意,1.2t的涡......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有11人支持该口碑有4508人看过评论(2)购物自驾游NaN
26ai7c2be2018款 185T CVT尊贵版 国V杭州杭州广汽丰田千骅萧山店2019年1月12.38?万元4100?公里2019-03-115.0【最满意的一点】丰田雷凌其实就是美版的卡罗拉,作为家用代步车让我是非常满意的,主要有以下几点......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有11人支持该口碑有5325人看过评论(9)购物自驾游NaN
28牛B41052018款 双擎 1.8H GS-V CVT尊贵版 国V杭州杭州丰田全通绍兴路店2018年12月14.58?万元2830?公里2019-03-104.0【最满意的一点】最满意的地方就是这辆车的油耗了,我的百公里油耗只有4.5升,而且并不会因为省......4.05.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有10人支持该口碑有7839人看过评论(0)接送小孩自驾游NaN
29村尾一棵草2018款 双擎 1.8H GS-V CVT尊贵版 国V杭州杭州丰田全通绍兴路店2019年1月13.68?万元NaN2019-03-095.0【最满意的一点】最满意的地方就数油耗了,这台车不管怎么跑,高速也好城市也罢,就算堵车堵的死死......4.05.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有11人支持该口碑有6795人看过评论(5)购物自驾游跑长途
31月作伴酒当歌2018款 双擎 1.8H GS-V CVT尊贵版 国V杭州杭州广汽丰田千骅萧山店2018年9月14.58?万元7500?公里2019-03-084.0【最满意的一点】外观看起来非常的运动,具有运动感,而且油耗也非常的低,这两点是我最满意的地方......4.05.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有11人支持该口碑有3981人看过评论(5)购物接送小孩NaN
32NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
33冰点蓝梦2018款 双擎 1.8H GS-V CVT尊贵版 国V杭州杭州丰田全通绍兴路店2018年11月14.58?万元5180?公里2019-03-075.0【最满意的一点】双擎最满意的肯定是省油,开汽油车最怕早晚高峰一堵车油耗就蹭蹭的涨,开双擎真的......4.05.0自驾游雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有8人支持该口碑有4832人看过评论(0)NaNNaNNaN
35段梦停DY2018款 185T CVT尊贵版 国V阜阳阜阳广汽丰田众合开发区店2018年11月11.40?万元2500?公里2019-03-065.0【最满意的一点】小雷凌已经提回来3个多月跑了2000多公里了,但是突然让我说说小雷凌什么地方......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有9人支持该口碑有6165人看过评论(4)接送小孩自驾游NaN
36未来的历程2018款 双擎 1.8H GS-V CVT尊贵版 国V杭州杭州广汽丰田千骅萧山店2018年12月14.58?万元3465?公里2019-03-065.0【最满意的一点】我最满意的就是这辆车的油耗了,真的比我想象中要少很多。真的是非常让我惊喜的一......4.05.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有3人支持该口碑有4013人看过评论(6)购物接送小孩NaN
37喜欢欢仔仔细细2018款 185T CVT尊贵版 国VI保定广汽丰田北京国机回龙观店2019年3月10.56?万元NaN2019-03-055.0【最满意的一点】动力1,2涡轮增压很够用,中控很喜欢,蓝色的线条增加了质感活力,看起来很运动......5.05.0上下班雷凌 2018款 185T CVT尊贵版 国VI?>>有8人支持该口碑有9128人看过评论(7)NaNNaNNaN
38八九老兵2018款 185T CVT尊贵版 国V杭州杭州丰田全通绍兴路店2018年11月12.88?万元5200?公里2019-03-055.0【最满意的一点】最满意的地方有两个,第一个省油,虽然不能够跟同门的双擎去比省油,但是在同价位......4.04.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有10人支持该口碑有5619人看过评论(2)自驾游NaNNaN
39我名叫涂纪2018款 双擎 1.8H GS-V CVT尊贵版 国V杭州杭州丰田全通绍兴路店2018年7月13.29?万元8200?公里2019-03-055.0【最满意的一点】最满意的地方当然是油耗了,当时买车也是冲着双擎省油去的,平均百公里油耗不到5......4.05.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有13人支持该口碑有4542人看过评论(1)购物自驾游NaN
40我子是白糖2018款 185T CVT尊贵版 国VI杭州杭州广汽丰田千骅萧山店2019年2月11.38?万元860?公里2019-03-035.0【最满意的一点】最满意的地方蛮多的,一下子都不知如何说起了,首先说下个人感觉亮点的部分吧,空......5.05.0自驾游雷凌 2018款 185T CVT尊贵版 国VI?>>有18人支持该口碑有16399人看过评论(8)商务接送上下班NaN
41妍安2018款 185T CVT尊贵版 国V杭州杭州广汽丰田千骅萧山店2018年12月12.88?万元4960?公里2019-03-024.0【最满意的一点】看着这个颜值我感觉就特别的正,会让我有一种心旷神怡的感觉了,而且车子的油耗方......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有12人支持该口碑有6105人看过评论(2)购物NaNNaN
44Liuchuanqi20182018款 185T CVT尊贵版 国V武汉广汽丰田景田民生武昌店2018年10月10.68?万元1999?公里2018-12-064.0【最满意的一点】首先是空间,后排凸起几乎没有,满载5人不显拥挤。其次是动力,1.2T116马......4.05.0购物雷凌 2018款 185T CVT尊贵版 国V?>>有31人支持该口碑有53880人看过评论(28)自驾游NaNNaN
..................................................................
329落小朵72018款 185T CVT豪华版昆明广汽丰田昆明旭成广福店2018年5月12.98?万元1846?公里2018-06-275.0【最满意的一点】动力足,隔音也很好,在高速上行驶很稳当,给我安全感!外观很时尚,油耗很低!【......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有3人支持该口碑有1898人看过评论(1)NaNNaNNaN
330Right_zhou22018款 185T CVT豪华版佛山广物汽贸佛山一环东店2018年5月11.00?万元850?公里2018-06-175.0【最满意的一点】外形设计好,后排空间非常大,空调够冷【最不满意的一点】暂时没发现【空间】空间......4.05.0接送小孩雷凌 2018款 185T CVT豪华版?>>有1人支持该口碑有3808人看过评论(4)上下班NaNNaN
331敬轩56311824642018款 185T CVT豪华版吉林中升广丰成邦店2018年4月10.48?万元2500?公里2018-05-275.0【最满意的一点】丰田品牌,价格挺满意。【最不满意的一点】用料做工一般【空间】空间是越大越好,......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有2人支持该口碑有14472人看过评论(4)自驾游NaNNaN
332cz10792018款 185T CVT豪华版赣州NaN2018年5月11.48?万元5000?公里2018-05-154.0【最满意的一点】油耗低【最不满意的一点】车漆薄,新车味道重【空间】空间:本人175公分乘坐空......3.05.0上下班雷凌 2018款 185T CVT豪华版?>>有3人支持该口碑有4383人看过评论(9)NaNNaNNaN
333a2915654902018款 185T CVT豪华版福州丰田宾联店2018年5月10.83?万元NaN2018-05-085.0【最满意的一点】外形时尚动感,果然丰田对于年青人审美的把握一如既往的犀利!小排量配涡轮,动力......3.03.0上下班雷凌 2018款 185T CVT豪华版?>>有15人支持该口碑有29080人看过评论(8)自驾游NaNNaN
334米迦勒天使2018款 185T CVT豪华版广州广汽丰田天河店2019年3月12.98?万元1000?公里2019-03-275.0【最满意的一点】车的外型超好看,座位舒服,后备箱面积大,对于常年出差来说方便放行李,家里人也......4.04.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有62人看过评论(0)接送小孩NaNNaN
335NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
337舶雲子2018款 185T CVT豪华版唐山唐山中润2018年5月10.58?万元11000?公里2018-05-265.0【最满意的一点】价格比卡罗拉全下来便宜小1万,平常上下班舒适性和油耗还不错,车到山前必有路,......3.05.0上下班雷凌 2018款 185T CVT豪华版?>>有6人支持该口碑有8708人看过评论(0)NaNNaNNaN
338里欧阳有灾2018款 185T CVT豪华版南京南京协众丰田东麒路店2018年7月12.98?万元NaN2018-09-115.0【最满意的一点】开了这么长时间,对雷凌这车最大的体会就是很均衡。要说优点的话,也没有特别明显......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有2078人看过评论(1)购物自驾游NaN
339雷青永2018款 185T CVT豪华版佛山南庄金利丰2018年7月11.26?万元9670?公里2018-09-025.0【最满意的一点】空间大、油耗低、价格公道。空间不管是前排、后排、后尾箱都很实用,日常实用都觉......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有1851人看过评论(0)自驾游NaNNaN
340烈马奔天2018款 185T CVT豪华版中山广汽丰田合田店2018年5月10.88?万元2400?公里2018-06-295.0【最满意的一点】空间真心的大,上个星期公司聚餐后排硬生生的塞进四个大人,也多亏了雷凌后排地板......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有5人支持该口碑有5350人看过评论(5)购物自驾游NaN
341wpba73zg2018款 185T CVT豪华版佛山佛山中元丰田店2018年5月10.68?万元2280?公里2018-06-295.0【最满意的一点】说到这车,对于大多数人来说,应该会觉得油耗会令人满意!但不好意思,暂时未有体......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有7人支持该口碑有5264人看过评论(7)泡妞NaNNaN
342lovehui3042018款 185T CVT豪华版深圳广汽丰田深业店2018年5月10.80?万元1600?公里2018-06-294.0【最满意的一点】外观,配置,价格,空间都是可以的,就像看自己的孩子,咋看都好看,喜欢的东西挑......4.04.0上下班雷凌 2018款 185T CVT豪华版?>>有5人支持该口碑有3979人看过评论(12)接送小孩NaNNaN
343机械灰键盘帅2018款 185T CVT豪华版中山广汽丰田庆丰沙朗店2018年6月10.98?万元427?公里2018-06-265.0【最满意的一点】选择雷凌!第一肯定是它的外观!外观就像一位性感的美女,车身设计“S”型恰到好......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有8人支持该口碑有3310人看过评论(2)购物NaNNaN
344不知名的德鲁伊2018款 185T CVT豪华版佛山丰田合丰大良2018年5月10.98?万元NaN2018-06-245.0【最满意的一点】最满意的应该算是这辆车的性价比了,10万添点的价格买下来的,比之前开的老轩逸......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有2643人看过评论(2)购物接送小孩自驾游
345藏锋20182018款 185T CVT豪华版宁波慈溪金港丰田2018年5月11.48?万元1000?公里2018-06-195.0【最满意的一点】雷凌185T豪华让我最满意的地方就是盲区检查这个功能,因为我是个新手,现在上......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有3人支持该口碑有2263人看过评论(0)接送小孩自驾游NaN
346老刘偶尔忙剐2018款 185T CVT豪华版中山广汽丰田合田店2018年5月11.38?万元1200?公里2018-06-035.0【最满意的一点】空间是最满意的,坐前排完全没有压抑感,看过许多车的后排都是凸起的,而雷凌的后......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有3人支持该口碑有4604人看过评论(3)NaNNaNNaN
347给我一个碗卡以够巴以2018款 185T CVT豪华版上海广汽丰田绅瑞2018年5月11.28?万元920?公里2018-06-025.0【最满意的一点】雷凌的1.2t发动机并没有想法中的那么肉,提速还是非常快的。动力方面还是比较......3.05.0上下班雷凌 2018款 185T CVT豪华版?>>有7人支持该口碑有15326人看过评论(7)自驾游NaNNaN
348WhiteDove鸽白小2018款 185T CVT豪华版哈尔滨丰田广龙机场路店2018年4月12.98?万元2190?公里2018-05-035.0【最满意的一点】运动外观显得年轻化。对车内空间的设计掌握的很好,后排地面没有凸起坐三个人不觉......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有2人支持该口碑有10942人看过评论(4)购物NaNNaN
349苗苗喵19902018款 185T CVT豪华版北京广汽丰田大昌联丰店2018年4月11.00?万元3900?公里2018-09-095.0【最满意的一点】作为一个新手司机很容易上手;空间很足,特别是后排,还有这就是开着比较省心,相......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有1055人看过评论(0)自驾游NaNNaN
350绕指柔情缠三世从彤2018款 185T CVT豪华版西安NaN2018年4月10.88?万元4500?公里2018-06-305.0【最满意的一点】雷凌的外形我个人很喜欢,尤其是前脸,看上去很有动感,但并不会显得过分张扬。1......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有2833人看过评论(2)购物跑长途NaN
351NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN...NaNNaNNaNNaNNaNNaNNaNNaNNaNNaN
352馒头力量2018款 185T CVT豪华版南京南京协众丰田东麒路店2018年5月11.50?万元400?公里2018-06-275.0【最满意的一点】空间!空间!空间!特别是后排,坐三个人也不会觉得特别拥挤,后排中间还是平的,......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有1人支持该口碑有2065人看过评论(1)自驾游NaNNaN
354刘小林子2018款 185T CVT豪华版十堰NaN2018年4月12.98?万元280?公里2018-06-105.0【最满意的一点】自动挡的车很好开,新书很容易上手。空间很大,特别是后排平的,三个人轻松装下。......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有1760人看过评论(10)接送小孩自驾游跑长途
356工厂赵2018款 185T CVT豪华版北京广汽丰田大昌联丰店2018年6月11.48?万元1597?公里2018-09-105.0【最满意的一点】外观耐看,空间够大,很炫,油耗也够省的。动力方面作为家庭车已经足够了!【最不......5.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有33人看过评论(0)购物接送小孩NaN
357赵5578258582018款 185T CVT豪华版台州广汽丰田台州温岭锦峰店2018年4月12.98?万元3000?公里2018-06-285.0【最满意的一点】油耗省,后备箱储物空间大,后排地板平整,坐起来舒适。【最不满意的一点】车身噪......4.04.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有322人看过评论(1)自驾游NaNNaN
358东莞合禾常平店2018款 185T CVT豪华版东莞广汽丰田合禾常平店2018年6月12.98?万元500?公里2018-06-255.0【最满意的一点】这款车空间可以,大多用于上下班,休息的时候和朋友同事外出旅游,基本都可以放下......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有2人支持该口碑有307人看过评论(2)购物NaNNaN
359祉僾2018款 185T CVT豪华版荆州NaN2018年5月11.28?万元1023?公里2018-06-143.0【最满意的一点】外观比较好看【最不满意的一点】油耗在市区始终降不下来【空间】空间:后排空间较......2.04.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有267人看过评论(0)接送小孩NaNNaN
360世人20152018款 185T CVT豪华版无锡NaN2018年5月10.50?万元880?公里2018-05-284.0【最满意的一点】喜欢的品牌,实惠的价格,漂亮的外观,足够的动力【最不满意的一点】网友好多说舒......3.05.0上下班雷凌 2018款 185T CVT豪华版?>>有9人支持该口碑有4876人看过评论(8)接送小孩自驾游NaN
361owl_xj2018款 185T CVT豪华版肇庆NaN2018年5月10.87?万元300?公里2018-05-255.0【最满意的一点】外观帅,空间大【最不满意的一点】还行,才用三天未发现不满意【空间】空间:空间......4.05.0上下班雷凌 2018款 185T CVT豪华版?>>有0人支持该口碑有3805人看过评论(3)接送小孩NaNNaN

300 rows × 25 columns

na_line2=levin2.isnull().all(1)   # 获取全部为缺失值NA的行
na_line2.sum()   # 统计有多少行全部缺失值——发现有23行,可删除。
23
# 好了可以开始缺失值处理了。
# 对于完全缺失的行,这里直接删除,对于部分缺失行,则进行填充。

levin2.shape   #先看看总数据量
(363, 25)
# 删除完全缺失的行,若不指定参数how,则删除的是所有含有nan的行
levin3=levin2.dropna(how='all')
levin3.shape
# 删除后,数据量从363行减少到340行,刚好是删除了23行全部为缺失值的行。
(340, 25)
# 对部分缺失行进行填充
# 这里采用先后两种填充方式:①针对数值型数据采用sklearn均值替换,②随后针对其他类型数值采用“后一行的值填充前一行的缺失值”
# ①利用sklearn替换缺失值。当缺失值为数值型数据时,可用利用均值来替换。
from sklearn.preprocessing import Imputer
numeric_levin = levin3.select_dtypes(exclude=['object'])
imr2=Imputer(missing_values="NaN",strategy="mean",axis=0)   # 按照行均值替换对应缺失值
imputed_data2=imr2.fit_transform(numeric_levin)
print(imputed_data2)

# Imputer类的fit方法:对数据集中的参数进行识别并构建相应的数据补齐模型
# Imputer类的transform方法:使用刚构建的数据补齐模型对数据集中相应参数的缺失值进行补齐。
# 数据补齐需要保持维度相同。
[[4. 3. 4. ... 4. 3. 3.]
 [5. 4. 5. ... 5. 4. 5.]
 [5. 4. 5. ... 5. 5. 5.]
 ...
 [4. 5. 5. ... 5. 3. 5.]
 [5. 4. 5. ... 5. 4. 5.]
 [5. 5. 4. ... 5. 5. 5.]]
# ②用后一行的值填充前一行的缺失值
levin4=levin3.fillna(method='backfill')
levin4.head(5)
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间text-cont...内饰性价比购车目的购买车型口碑支持人数浏览人数评论数购车目的2购车目的3购车目的4
1VOLVO1102018款 双擎 1.8H GS-V CVT尊贵版 国V广州广汽丰田天河店2018年11月13.18?万元3300?公里2018-11-294.0【最满意的一点】最满意当然是油耗,还有就是能在广州摇节能号,广州人都知道摇号不是一般的难啊,......3.03.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有26人支持该口碑有47833人看过评论(25)自驾游泡妞跑长途
2真是张三2018款 185T CVT尊贵版 国V长沙广汽丰田长沙长威中南店2018年10月10.78?万元5600?公里2019-03-275.0【最满意的一点】价格合适,外观时尚,空间还不错,油耗比较低,加速顿挫感小,动力足,操控性好。......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有0人支持该口碑有1738人看过评论(3)接送小孩泡妞跑长途
3寻找高营2018款 185T CVT尊贵版 国VI徐州浩邦丰田2019年3月10.88?万元678?公里2019-03-265.0【最满意的一点】对于我这样追求美的年轻人来说,最满意的当然是它的外观了。整个看起来非常的年轻......5.05.0上下班雷凌 2018款 185T CVT尊贵版 国VI?>>有0人支持该口碑有2436人看过评论(1)自驾游自驾游跑长途
4哈哈呵呵嘿嘿嘻嘻呼呼2018款 185T CVT尊贵版 国V东营东营东辉2019年3月12.88?万元375?公里2019-03-255.0【最满意的一点】车身设计上窄下款,给人一种很有抓地力的感觉。车内空间很大,内饰做的很漂亮,天......5.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有0人支持该口碑有2973人看过评论(3)购物自驾游跑长途
5云麓道长置2018款 185T CVT尊贵版 国VI广州广汽丰田天河店2019年3月12.88?万元133?公里2019-03-244.0【最满意的一点】丰田车是不错,选择雷凌也是因为它有丰田标准基因。省油,耐开,没毛病。而且从理......5.05.0上下班雷凌 2018款 185T CVT尊贵版 国VI?>>有1人支持该口碑有3763人看过评论(5)泡妞自驾游购物

5 rows × 25 columns

import re
# mum_corolla=re.sub("\D","",corolla4.裸车购买价)
# print(mum_corolla)

# TypeError: expected string or bytes-like object
# 需要先把中文列明更改为英文字符。
corolla4.columns   #查看各列名
Index(['name-text', '车型', '购买地点', '购车经销商', '购买时间', '裸车购买价', '目前行驶', '发表时间',
       '空间', '动力', '操控', '油耗', '舒适性', 'text-cont', '外观', '内饰', '性价比', '购买车型',
       '口碑支持人数', '浏览人数', '评论数', '购车目的1', '购车目的2'],
      dtype='object')
corolla4.head(3)
name-text车型购买地点购车经销商购买时间裸车购买价目前行驶发表时间空间动力...text-cont外观内饰性价比购买车型口碑支持人数浏览人数评论数购车目的1购车目的2
1八号零陈2018款 双擎 1.8L E-CVT智尚版北京北京中业丰田2018年12月14.18?万元2500?公里2019-01-134.03.0...【最满意的一点】乘坐空间 皮质座椅 灯光 外观【最不满意的一点】隔音 高速上风燥明显【空间】...4.04.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有36人支持该口碑有82222人看过评论(29)购物接送小孩
2辛亦2018款 1.2T S-CVT GL智享版泉州泉州宾联#2019年1月11.28?万元4361?公里2019-03-254.03.0...【最满意的一点】1、油耗 油耗对比以前开过的福克斯、凯越、艾瑞泽、XRV等来说还是非常有优势...3.04.05.0卡罗拉 2018款 1.2T S-CVT GL智享版?>>有5人支持该口碑有9570人看过评论(9)接送小孩接送小孩
3张某某93902018款 双擎 1.8L E-CVT智尚版郑州郑州裕华丰田2018年9月14.43?万元5339?公里2018-09-134.05.0...【最满意的一点】目前开的比较少,才小500km,要说目前最满意,就是省油和比较安静吧。【最不...4.01.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有101人支持该口碑有200279人看过评论(51)自驾游接送小孩

3 rows × 23 columns


corolla5=corolla4.rename(columns={"裸车购买价":"nakedprice","目前行驶":"driven-distance","口碑支持人数":"support","浏览人数":"read","评论数":"reviews"})   # 只改要改的列名 
corolla5.head(1)
#  或 统一一齐改所有列名
#  corolla.columns=['name-text', '车型', '购买地点', '购车经销商', '购买时间', '裸车购买价', '目前行驶', '发表时间',
#        '空间', '动力', '操控', '油耗', '舒适性', 'text-cont', '外观', '内饰', '性价比', '购买车型',
#        '口碑支持人数', '浏览人数', '评论数', '购车目的1', '购车目的2']
name-text车型购买地点购车经销商购买时间nakedpricedriven-distance发表时间空间动力...text-cont外观内饰性价比购买车型supportreadreviews购车目的1购车目的2
1八号零陈2018款 双擎 1.8L E-CVT智尚版北京北京中业丰田2018年12月14.18?万元2500?公里2019-01-134.03.0...【最满意的一点】乘坐空间 皮质座椅 灯光 外观【最不满意的一点】隔音 高速上风燥明显【空间】...4.04.04.0卡罗拉 2018款 双擎 1.8L E-CVT智尚版?>>有36人支持该口碑有82222人看过评论(29)购物接送小孩

1 rows × 23 columns

# 重试,提取字符串中的数字
# mum_corolla=re.sub("\D","",corolla5.nakedprice)
# print(mum_corolla)

# 运行报错 TypeError: expected string or bytes-like object
print(type(corolla5))   #查看整表数据类型
<class 'pandas.core.frame.DataFrame'>
print(type(corolla5.nakedprice))   #查看字段数据类型
<class 'pandas.core.series.Series'>
# print(re.findall(r"\d+\.?\d*",corolla5.nakedprice))

# 依然报同样的错 TypeError: expected string or bytes-like object

# 看来要解决字符串类型问题了。
# corolla5["nakedprice"]=corolla5["nakedprice"].astype("string")
# print(corolla5.dtypes)
# TypeError: data type "string" not understood

# corolla5["nakedprice"]=corolla5["nakedprice"].astype("float64")
# print(corolla5.dtypes)
# ValueError: could not convert string to float: '1    14.18?万元\nName: nakedprice, dtype: object'

# 又经历两次尝试,未能更改字符串。下面继续。
corolla5["nakedprice"]=str(corolla5["nakedprice"])
print(corolla5.dtypes)
name-text           object
车型                  object
购买地点                object
购车经销商               object
购买时间                object
nakedprice          object
driven-distance     object
发表时间                object
空间                 float64
动力                 float64
操控                 float64
油耗                 float64
舒适性                float64
text-cont           object
外观                 float64
内饰                 float64
性价比                float64
购买车型                object
support             object
read                object
reviews             object
购车目的1               object
购车目的2               object
dtype: object
# mum_corolla=re.sub("\D","",corolla5.nakedprice)
# print(mum_corolla)

# 重试,仍然报错 TypeError: expected string or bytes-like object
# 去掉字段限制,直接转换整个dataframe
# corolla5=str(corolla5)
# print(corolla5.dtypes)

# 运行报错 AttributeError: 'str' object has no attribute 'dtypes'
# 忽略查看类型,直接看看能不能提取字段

# corolla5=str(corolla5)
# mum_corolla=re.sub("\D","",corolla5.nakedprice)
# print(mum_corolla)

# 运行报错 AttributeError: 'str' object has no attribute 'nakedprice'
# 那接下来去掉“'nakedprice'”试试
corolla5=str(corolla5)
mum_corolla=re.sub("\D","",corolla5)
print(mum_corolla)

# 去掉“'nakedprice'”后,运行没有出错,不过出来的结果,又乱又花,不知道什么意思。还得继续搞正确。
12018182018122201812201913939020181820189420181820191520181820181262018122019372982018122019182018182018109201812201810102018122018911902018122018101220181220181113312018122018121420181220181115201818201851720181220188184182018182018919201812201862067820181820181121711201812201842220181220181023201818201872420181220189256668201812201882606012018182018927201818201872820042720181820184291201818201863020181820184312018182018740120181220183402199009212018122018104032018122018104042018122018840520181820189406201812201884072018122018640820181820186409201812201894102018182018641199242018122018941220181220186413201812201844142018122018641599920181220188417684201812201884182018182018541935612018182018542020181220186421201812420188422201812201874232018122018642420181220185425201818201834262018122018642766666666201812201864282018182018642920181220185430201812201844312018122018411418250020190113403021128436120190325403031443533920180913405041418135020190315304051428900020190314504061138420201903104040711003000201903095030814533900201812165030911781899201902065050101288145542018112950501110702000201901085050121248507820181130504013107010002018123040401411282000201812195050151498570020181218405017109828002018121140301814286400201812015040191270790320180610504020147815620181125504021123850002018042950502213665002018111550502314381050020181115505024128810852018101750502511281728201810075040261438230201810065050271460130002018091550402814704000201805025050291488388420180818304030150830502018060850303114483002018072150404011128869201810265050402130010002018102650504031208800201810245050404127810002018102450504051488350020181017505040611882200201810135050407119857002018101250504081528400020181010505040912132160201810095050410146048002018092850504111078230020180928504041212382300201809285050413113810982018092750404141178380020180920505041513482540201809165050417110015020180829504041814504600201808274040419136090020180818405042012682000201808185040421106810201808105040422116825002018080540404231100250020180730505042413081800201807265040425152820002018062750504261258200020180627505042711003000201806225050428144875020180619405042910981560201806095050430119835002018060450504311260100020180502404014040402130405035004010404403040550504064030507404050814245030409404040105030401150505012607050305013504030145040401550504017123453030401840504019503020205040402150305022403050235030502450403025503040265020502717845050502850404029303030305030503140405040150405040250405040350405040450405040550405040611880050003500505050407505050408504050409504050410505050411504050412504050413505050414505050415504050417504040418405040419505050420505050421302040422404030423505050424504040425503050426301050427504050428040304042950405043050305043110403050112018183682222292201812595709320181810120027951420181885423452018181711511662018122738825157201812182425788201818621108984892018124779981431020181255110259701120181285194138431220181229614252513201812411281497114201812681161602215201818455345821172018125994487391820181862779802319201812213465475132202018181842441292120181235953637236822201812576394217232018182243860212420181227579902025201812701731906626201818621082512627201818638769538282018182755926442042920181842892013130201818178480176218312018184090003394012018120541040220181205140403201812148314042018120196040520181802150406201812322205407201812030704082018181999240920181209621410201818210761411201812011391412201812085804132018120178041420181203880415201812014671417201812037220418201818091314192018180114254202018124896142120181219790422201812023210423201812315855424201812586493425201818133221426201812129443427201812334382428201818125060842920181258594243020181291620036431201812363893914212345678910111213141517181920212223242526272829303140140240340440540640740840941041141241341441541741841942042142242342442542642742842943043140523
# 刚刚 re.sub 尝试失败,现在试试 re.findall,虽然也乱,不过比上面那个语句结果好一点点。
corolla5=str(corolla5)
print(re.findall(r"\d+\.?\d*",corolla5))
['1', '2018', '1.8', '2018', '12', '2', '2018', '1.2', '2019', '1', '3', '9390', '2018', '1.8', '2018', '9', '4', '2018', '1.8', '2019', '1', '5', '2018', '1.8', '2018', '12', '6', '2018', '1.2', '2019', '3', '7', '2', '9', '8', '2018', '1.2', '2019', '1', '8', '2018', '1.8', '2018', '10', '9', '2018', '1.2', '2018', '10', '10', '2018', '1.2', '2018', '9', '11', '90', '2018', '1.2', '2018', '10', '12', '2018', '1.2', '2018', '11', '13', '31', '2018', '1.2', '2018', '12', '14', '2018', '1.2', '2018', '11', '15', '2018', '1.8', '2018', '5', '17', '2018', '1.2', '2018', '8', '18', '418', '2018', '1.8', '2018', '9', '19', '2018', '1.2', '2018', '6', '20', '678', '2018', '1.8', '2018', '11', '21', '711', '2018', '1.2', '2018', '4', '22', '2018', '1.2', '2018', '10', '23', '2018', '1.8', '2018', '7', '24', '2018', '1.2', '2018', '9', '25', '6668', '2018', '1.2', '2018', '8', '26', '0601', '2018', '1.8', '2018', '9', '27', '2018', '1.8', '2018', '7', '28', '200427', '2018', '1.8', '2018', '4', '29', '1', '2018', '1.8', '2018', '6', '30', '2018', '1.8', '2018', '4', '31', '2018', '1.8', '2018', '7', '401', '2018', '1.2', '2018', '3', '402', '19900921', '2018', '1.2', '2018', '10', '403', '2018', '1.2', '2018', '10', '404', '2018', '1.2', '2018', '8', '405', '2018', '1.8', '2018', '9', '406', '2018', '1.2', '2018', '8', '407', '2018', '1.2', '2018', '6', '408', '2018', '1.8', '2018', '6', '409', '2018', '1.2', '2018', '9', '410', '2018', '1.8', '2018', '6', '411', '9924', '2018', '1.2', '2018', '9', '412', '2018', '1.2', '2018', '6', '413', '2018', '1.2', '2018', '4', '414', '2018', '1.2', '2018', '6', '415', '999', '2018', '1.2', '2018', '8', '417', '68', '4', '2018', '1.2', '2018', '8', '418', '2018', '1.8', '2018', '5', '419', '3561', '2018', '1.8', '2018', '5', '420', '2018', '1.2', '2018', '6', '421', '2018', '1.2', '4', '2018', '8', '422', '2018', '1.2', '2018', '7', '423', '2018', '1.2', '2018', '6', '424', '2018', '1.2', '2018', '5', '425', '2018', '1.8', '2018', '3', '426', '2018', '1.2', '2018', '6', '427', '6666666', '6', '2018', '1.2', '2018', '6', '428', '2018', '1.8', '2018', '6', '429', '2018', '1.2', '2018', '5', '430', '2018', '1.2', '2018', '4', '431', '2018', '1.2', '2018', '4', '1', '14.18', '2500', '2019', '01', '13', '4.0', '3.0', '2', '11.28', '4361', '2019', '03', '25', '4.0', '3.0', '3', '14.43', '5339', '2018', '09', '13', '4.0', '5.0', '4', '14.18', '1350', '2019', '03', '15', '3.0', '4.0', '5', '14.28', '9000', '2019', '03', '14', '5.0', '4.0', '6', '11.38', '420', '2019', '03', '10', '4.0', '4.0', '7', '11.00', '3000', '2019', '03', '09', '5.0', '3.0', '8', '14.53', '3900', '2018', '12', '16', '5.0', '3.0', '9', '11.78', '1899', '2019', '02', '06', '5.0', '5.0', '10', '12.88', '14554', '2018', '11', '29', '5.0', '5.0', '11', '10.70', '2000', '2019', '01', '08', '5.0', '5.0', '12', '12.48', '5078', '2018', '11', '30', '5.0', '4.0', '13', '10.70', '1000', '2018', '12', '30', '4.0', '4.0', '14', '11.28', '2000', '2018', '12', '19', '5.0', '5.0', '15', '14.98', '5700', '2018', '12', '18', '4.0', '5.0', '17', '10.98', '2800', '2018', '12', '11', '4.0', '3.0', '18', '14.28', '6400', '2018', '12', '01', '5.0', '4.0', '19', '12.70', '7903', '2018', '06', '10', '5.0', '4.0', '20', '14.78', '156', '2018', '11', '25', '5.0', '4.0', '21', '12.38', '5000', '2018', '04', '29', '5.0', '5.0', '22', '13.66', '500', '2018', '11', '15', '5.0', '5.0', '23', '14.38', '10500', '2018', '11', '15', '5.0', '5.0', '24', '12.88', '1085', '2018', '10', '17', '5.0', '5.0', '25', '11.28', '1728', '2018', '10', '07', '5.0', '4.0', '26', '14.38', '230', '2018', '10', '06', '5.0', '5.0', '27', '14.60', '13000', '2018', '09', '15', '5.0', '4.0', '28', '14.70', '4000', '2018', '05', '02', '5.0', '5.0', '29', '14.88', '3884', '2018', '08', '18', '3.0', '4.0', '30', '15.08', '3050', '2018', '06', '08', '5.0', '3.0', '31', '14.48', '300', '2018', '07', '21', '5.0', '4.0', '401', '11.28', '869', '2018', '10', '26', '5.0', '5.0', '402', '13.00', '1000', '2018', '10', '26', '5.0', '5.0', '403', '12.08', '800', '2018', '10', '24', '5.0', '5.0', '404', '12.78', '1000', '2018', '10', '24', '5.0', '5.0', '405', '14.88', '3500', '2018', '10', '17', '5.0', '5.0', '406', '11.88', '2200', '2018', '10', '13', '5.0', '5.0', '407', '11.98', '5700', '2018', '10', '12', '5.0', '5.0', '408', '15.28', '4000', '2018', '10', '10', '5.0', '5.0', '409', '12.13', '2160', '2018', '10', '09', '5.0', '5.0', '410', '14.60', '4800', '2018', '09', '28', '5.0', '5.0', '411', '10.78', '2300', '2018', '09', '28', '5.0', '4.0', '412', '12.38', '2300', '2018', '09', '28', '5.0', '5.0', '413', '11.38', '1098', '2018', '09', '27', '5.0', '4.0', '414', '11.78', '3800', '2018', '09', '20', '5.0', '5.0', '415', '13.48', '2540', '2018', '09', '16', '5.0', '5.0', '417', '11.00', '150', '2018', '08', '29', '5.0', '4.0', '418', '14.50', '4600', '2018', '08', '27', '4.0', '4.0', '419', '13.60', '900', '2018', '08', '18', '4.0', '5.0', '420', '12.68', '2000', '2018', '08', '18', '5.0', '4.0', '421', '10.68', '10', '2018', '08', '10', '5.0', '4.0', '422', '11.68', '2500', '2018', '08', '05', '4.0', '4.0', '423', '11.00', '2500', '2018', '07', '30', '5.0', '5.0', '424', '13.08', '1800', '2018', '07', '26', '5.0', '4.0', '425', '15.28', '2000', '2018', '06', '27', '5.0', '5.0', '426', '12.58', '2000', '2018', '06', '27', '5.0', '5.0', '427', '11.00', '3000', '2018', '06', '22', '5.0', '5.0', '428', '14.48', '750', '2018', '06', '19', '4.0', '5.0', '429', '10.98', '1560', '2018', '06', '09', '5.0', '5.0', '430', '11.98', '3500', '2018', '06', '04', '5.0', '5.0', '431', '12.60', '1000', '2018', '05', '02', '4.0', '4.0', '1', '4.0', '4.0', '4.0', '2', '1', '3.0', '4.0', '5.0', '3', '500', '4.0', '1.0', '4.0', '4', '4.0', '3.0', '4.0', '5', '5.0', '5.0', '4.0', '6', '4.0', '3.0', '5.0', '7', '4.0', '4.0', '5.0', '8', '1', '4.2', '4.', '5.0', '3.0', '4.0', '9', '4.0', '4.0', '4.0', '10', '5.0', '3.0', '4.0', '11', '5.0', '5.0', '5.0', '12', '60', '70', '5.0', '3.0', '5.0', '13', '5.0', '4.0', '3.0', '14', '5.0', '4.0', '4.0', '15', '5.0', '5.0', '4.0', '17', '1.', '2.', '3.', '4.', '5.', '3.0', '3.0', '4.0', '18', '4.0', '5.0', '4.0', '19', '5.0', '3.0', '2.0', '20', '5.0', '4.0', '4.0', '21', '5.0', '3.0', '5.0', '22', '4.0', '3.0', '5.0', '23', '5.0', '3.0', '5.0', '24', '5.0', '4.0', '3.0', '25', '5.0', '3.0', '4.0', '26', '5.0', '2.0', '5.0', '27', '1.78', '4.', '5.0', '5.0', '5.0', '28', '5.0', '4.0', '4.0', '29', '3.0', '3.0', '3.0', '30', '5.0', '3.0', '5.0', '31', '4.0', '4.0', '5.0', '401', '5.0', '4.0', '5.0', '402', '5.0', '4.0', '5.0', '403', '5.0', '4.0', '5.0', '404', '5.0', '4.0', '5.0', '405', '5.0', '4.0', '5.0', '406', '118800', '5000', '3500', '5.0', '5.0', '5.0', '407', '5.0', '5.0', '5.0', '408', '5.0', '4.0', '5.0', '409', '5.0', '4.0', '5.0', '410', '5.0', '5.0', '5.0', '411', '5.0', '4.0', '5.0', '412', '5.0', '4.0', '5.0', '413', '5.0', '5.0', '5.0', '414', '5.0', '5.0', '5.0', '415', '5.0', '4.0', '5.0', '417', '5.0', '4.0', '4.0', '418', '4.0', '5.0', '4.0', '419', '5.0', '5.0', '5.0', '420', '5.0', '5.0', '5.0', '421', '3.0', '2.0', '4.0', '422', '4.0', '4.0', '3.0', '423', '5.0', '5.0', '5.0', '424', '5.0', '4.0', '4.0', '425', '5.0', '3.0', '5.0', '426', '3.0', '1.0', '5.0', '427', '5.0', '4.0', '5.0', '428', '0', '4.0', '3.0', '4.0', '429', '5.0', '4.0', '5.0', '430', '5.0', '3.0', '5.0', '431', '10', '4.0', '3.0', '5.0', '1', '1', '2018', '1.8', '36', '82222', '29', '2', '2018', '1.2', '5', '9570', '9', '3', '2018', '1.8', '101', '200279', '51', '4', '2018', '1.8', '8', '5423', '4', '5', '2018', '1.8', '17', '11511', '6', '6', '2018', '1.2', '27', '38825', '15', '7', '2018', '1.2', '18', '24257', '8', '8', '2018', '1.8', '62', '110898', '48', '9', '2018', '1.2', '47', '79981', '43', '10', '2018', '1.2', '55', '110259', '70', '11', '2018', '1.2', '85', '194138', '43', '12', '2018', '1.2', '29', '61425', '25', '13', '2018', '1.2', '41', '128149', '71', '14', '2018', '1.2', '68', '116160', '22', '15', '2018', '1.8', '45', '53458', '21', '17', '2018', '1.2', '59', '94487', '39', '18', '2018', '1.8', '62', '77980', '23', '19', '2018', '1.2', '213', '465475', '132', '20', '2018', '1.8', '18', '42441', '29', '21', '2018', '1.2', '359', '536372', '368', '22', '2018', '1.2', '57', '63942', '17', '23', '2018', '1.8', '22', '43860', '21', '24', '2018', '1.2', '27', '57990', '20', '25', '2018', '1.2', '70', '173190', '66', '26', '2018', '1.8', '62', '108251', '26', '27', '2018', '1.8', '63', '87695', '38', '28', '2018', '1.8', '275', '592644', '204', '29', '2018', '1.8', '42', '89201', '31', '30', '2018', '1.8', '178', '480176', '218', '31', '2018', '1.8', '40', '90003', '39', '401', '2018', '1.2', '0', '541', '0', '402', '2018', '1.2', '0', '514', '0', '403', '2018', '1.2', '1', '483', '1', '404', '2018', '1.2', '0', '196', '0', '405', '2018', '1.8', '0', '215', '0', '406', '2018', '1.2', '3', '2220', '5', '407', '2018', '1.2', '0', '307', '0', '408', '2018', '1.8', '1', '999', '2', '409', '2018', '1.2', '0', '962', '1', '410', '2018', '1.8', '2', '1076', '1', '411', '2018', '1.2', '0', '1139', '1', '412', '2018', '1.2', '0', '858', '0', '413', '2018', '1.2', '0', '178', '0', '414', '2018', '1.2', '0', '388', '0', '415', '2018', '1.2', '0', '1467', '1', '417', '2018', '1.2', '0', '3722', '0', '418', '2018', '1.8', '0', '913', '1', '419', '2018', '1.8', '0', '1142', '5', '420', '2018', '1.2', '4', '896', '1', '421', '2018', '1.2', '1', '979', '0', '422', '2018', '1.2', '0', '2321', '0', '423', '2018', '1.2', '3', '1585', '5', '424', '2018', '1.2', '5', '8649', '3', '425', '2018', '1.8', '1', '3322', '1', '426', '2018', '1.2', '1', '2944', '3', '427', '2018', '1.2', '3', '3438', '2', '428', '2018', '1.8', '12', '5060', '8', '429', '2018', '1.2', '5', '8594', '2', '430', '2018', '1.2', '9', '16200', '36', '431', '2018', '1.2', '36', '38939', '14', '2', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26', '27', '28', '29', '30', '31', '401', '402', '403', '404', '405', '406', '407', '408', '409', '410', '411', '412', '413', '414', '415', '417', '418', '419', '420', '421', '422', '423', '424', '425', '426', '427', '428', '429', '430', '431', '405', '23']
corolla5=str(corolla5)
mum_cor=re.sub("\D","",corolla5["nakedprice"])
print(num_cor)

# 运行报错 TypeError: string indices must be integers
---------------------------------------------------------------------------

TypeError                                 Traceback (most recent call last)

<ipython-input-86-742617795b21> in <module>()
      1 corolla5=str(corolla5)
----> 2 mum_cor=re.sub("\D","",corolla5["nakedprice"])
      3 print(num_cor)


TypeError: string indices must be integers
# 算了先不管了,这个Python字符串中提取数字的坎。待会儿用excel来搞定,然后顺利进行下一步。
# 先把雷凌的列名改成英文字符,重新保存成新文件。
levin4.columns   #查看各列名
Index(['name-text', '车型', '购买地点', '购车经销商', '购买时间', '裸车购买价', '目前行驶', '发表时间',
       '空间', 'text-cont', '动力', '操控', '油耗', '舒适性', '外观', '内饰', '性价比', '购车目的',
       '购买车型', '口碑支持人数', '浏览人数', '评论数', '购车目的2', '购车目的3', '购车目的4'],
      dtype='object')
levin5=levin4.rename(columns={"裸车购买价":"nakedprice","目前行驶":"driven-distance","口碑支持人数":"support","浏览人数":"read","评论数":"reviews"})   # 只改要改的列名 
levin5.head(2)
name-text车型购买地点购车经销商购买时间nakedpricedriven-distance发表时间空间text-cont...内饰性价比购车目的购买车型supportreadreviews购车目的2购车目的3购车目的4
1VOLVO1102018款 双擎 1.8H GS-V CVT尊贵版 国V广州广汽丰田天河店2018年11月13.18?万元3300?公里2018-11-294.0【最满意的一点】最满意当然是油耗,还有就是能在广州摇节能号,广州人都知道摇号不是一般的难啊,......3.03.0上下班雷凌 2018款 双擎 1.8H GS-V CVT尊贵版 国V?>>有26人支持该口碑有47833人看过评论(25)自驾游泡妞跑长途
2真是张三2018款 185T CVT尊贵版 国V长沙广汽丰田长沙长威中南店2018年10月10.78?万元5600?公里2019-03-275.0【最满意的一点】价格合适,外观时尚,空间还不错,油耗比较低,加速顿挫感小,动力足,操控性好。......4.05.0上下班雷凌 2018款 185T CVT尊贵版 国V?>>有0人支持该口碑有1738人看过评论(3)接送小孩泡妞跑长途

2 rows × 25 columns

# import pandas as pd
# corolla5.to_csv("corolla_1st_deal.csv",encoding="gbk")   

#把corolla5的数据导出CSV文件

# 运行报错,且查询无果。AttributeError: 'str' object has no attribute 'to_csv'
import pandas as pd
levin5.to_csv("levin_1st_deal.xlsx",encoding="gbk")   
#把levin5的数据导出CSV文件,直接成功。因为前面没有对levin5做过str转换。
# 回去str转换之前的生成corolla5那一步(改列名成英文字符),重新运行生成corolla5
corolla5.to_csv("corolla_1st_deal.csv",encoding="gbk")   
# 把corolla5的数据导出CSV文件,成功
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
<p><fontface>本程序基于新云网站管理系统V3.0.0.610修改美化,适合做文章、新闻、信息类综合网站,含6条采集规则,可自动抓取信息,因压缩包大小问题,删除生成的内容网页和文中图片,其余数据完整。</font></p> <p><fontface>采用新云系统成熟、稳定地技术ASP+Access/SQL修改而成,通过它,您可以很方便地管理自己网站。</font></p> <p><fontface>修改者声明:你可以任意修改程序,请保留我一个友情链接。 链接地址:http://www.ipaoniu.com/</font></p> <p><fontface>功能特点如下:(来自新云的官方说明)</font></p> <p><fontface>多频道管理,无限制频道克隆,支持频道二级域名绑定功能,文章内容自动分页;</font></p> <p><fontface>全站生成HTML页面;增加系统安全性,自由设置生成HTML文件扩展名和存放目录,内容自动分页。</font></p> <p><fontface>用户管理,多用户管理分权限发布、管理软件信息;用户短信、收藏功能,会员在线充值,网银在线支付;</font></p> <p><fontface>下载模块,支持计点会员和包月会员下载,反点等功能,无限制添加下载服务器,下载点数设置,添加软件只需要填写软件名称;</font></p> <p><fontface>强大的文章、软件采集功能,文章采集的同时可以选择是否下载图片到本地及分页采集; 其它模块,留言、友情连接自助申请,上传水印,内容关键字功能。</font></p> <p><fontface>后台登陆地址:/admin/admin_login.asp 默认管理员:admin 密码:ipaoniu</font></p>

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值