前言
大家早好、午好、晚好吖 ❤ ~欢迎光临本文章
什么是数据分析
明确目的–获得数据(爬虫,现有,公开的数据)–数据预处理——数据可视化——结论
准备
环境使用:
在开始写我们的代码之前,我们要准备好运行代码的程序
-
Anaconda (python3.9)
–> 识别我们写的代码
开发工具:
-
jupyter notebook
–> 代码编辑功能敲代码的工具
不会安装的可以文末名片+我获取哦 😎
python资料、源码、教程: 点击此处跳转文末名片获取
1.导入模块
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
2.导入数据
boss = pd.read_csv('招聘数据.csv', engine='python', encoding='utf-8')
boss
boss.shape
3.数据处理
3.1 查看重复值
boss.duplicated().sum()
3.2 查看缺失值
boss.isnull().sum()
3.3 缺失值处理
boss.dropna(subset=['薪资'], inplace=True)
boss.isnull().sum()
boss['公司福利'].fillna('无'</