数据下载入口:Pandas+Pyecharts | 上海市餐饮数据分析可视化 - Heywhale.com
数据介绍
- 类别:餐饮类别的名称(如烧烤、美食、粤菜等)
- 行政区:餐厅所在行政区的名称(如浦东新区、闵行区等)
- 点评数:该餐厅的点评数量
- 口味、环境、服务:餐厅在这三个方面的评分
- 人均消费:餐厅的人均消费
- 城市:餐厅所在的城市(上海市)
- Lng、Lat:餐厅的经纬度
首先先读取数据:
import pandas as pd
# 尝试的编码格式列表
encodings_tried = ['utf-8', 'gbk', 'ISO-8859-1', 'latin1']
# 文件路径
file_path = '上海餐饮数据.csv'
# 尝试使用不同的编码格式读取文件
for encoding in encodings_tried:
try:
df = pd.read_csv(file_path, encoding=encoding)
print(f"成功使用编码格式 {encoding} 读取文件")
break # 如果成功读取,则跳出循环
except UnicodeDecodeError:
print(f"编码格式 {encoding} 读取文件时发生错误")
continue # 如果发生错误,则尝试下一个编码
df
由于下载的csv文件不是utf-8编码,所以需要用其他编码读取方式进行读取,数据概览如下:
一:数据预处理