数据获取
我们利用scrapy爬虫框架对去哪儿网对景点数据进行抓取,部分数据如下:
加载数据
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
#加载数据
df = pd.read_csv("data.csv")
df.head()
数据预处理
处理景区等级,只保留数字,且对没有等级的用0填充
df['level'] = df['level'].fillna(0)
df['level'] = df['level'].apply(lambda x:0 if x==0 else int(x[0]))
df