学习目标:
- 一周掌握基本知识
学习内容:
- pandas库的时间日期高效操作 .dt.
示例代码
sales_data['order_date'].dt.year
例子
dt.year能直接提取出年份,而且是整数型。
同样还可以提取月、日
- groupby
在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。
在Pandas中,上述的数据处理操作主要运用groupby完成。
总结来说,groupby的过程就是将原有的DataFrame按照groupby的字段(这里是company),划分为若干个分组DataFrame,被分为多少个组就有多少个分组DataFrame
参考链接
- apply
Pandas数据处理三板斧——map、apply、applymap详解
- reset_index()
reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=‘’)
示例
5.seaborn: hue用来分类
使用hue来分类后
6.Python数据可视化-seaborn库之countplot
countplot是seaborn库中分类图的一种,作用是使用条形显示每个分箱器中的观察计数。
sns.countplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, dodge=True, ax=None, **kwargs)
学习时间:
- 周日下午 6点-下午 8 点
学习产出:
- CSDN 技术博客 1 篇
import os
import importlib.util
# 获取当前工作目录
current_directory = os.getcwd()
# 构建utils文件夹的绝对路径
utils_directory = os.path.abspath('utils')
# 遍历utils文件夹下的所有.py文件
for file in os.listdir(utils_directory):
if file.endswith('.py'):
module_name = os.path.splitext(file)[0] # 去除文件扩展名.py
module_path = os.path.join(utils_directory, file)
# 使用importlib动态导入模块
spec = importlib.util.spec_from_file_location(module_name, module_path)
module = importlib.util.module_from_spec(spec)
spec.loader.exec_module(module)
# 将模块导入当前命名空间
globals()[module_name] = module