机器学习记录（二）

4v1d

已于 2024-04-07 17:39:59 修改

阅读量258

点赞数 1

文章标签：机器学习 pandas python

于 2023-04-02 19:40:47 首次发布

本文链接：https://blog.csdn.net/weixin_51213906/article/details/129915183

版权

学习目标：

一周掌握基本知识

学习内容：

pandas库的时间日期高效操作 .dt.
示例代码

sales_data['order_date'].dt.year

例子
在这里插入图片描述
dt.year能直接提取出年份，而且是整数型。

在这里插入图片描述
同样还可以提取月、日

groupby

在日常的数据分析中，经常需要将数据根据某个（多个）字段划分为不同的群体（group）进行分析，如电商领域将全国的总销售额根据省份进行划分，分析各省销售额的变化情况，社交领域将用户根据画像（性别、年龄）进行细分，研究用户的使用情况和偏好等。
在Pandas中，上述的数据处理操作主要运用groupby完成。

总结来说，groupby的过程就是将原有的DataFrame按照groupby的字段（这里是company），划分为若干个分组DataFrame，被分为多少个组就有多少个分组DataFrame
参考链接

apply

Pandas数据处理三板斧——map、apply、applymap详解

reset_index()

reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=‘’)

在这里插入图片描述
示例

在这里插入图片描述
5.seaborn: hue用来分类

使用hue来分类后

6.Python数据可视化-seaborn库之countplot

countplot是seaborn库中分类图的一种，作用是使用条形显示每个分箱器中的观察计数。

sns.countplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, dodge=True, ax=None, **kwargs)

在这里插入图片描述

学习时间：

周日下午 6点-下午 8 点

学习产出：

CSDN 技术博客 1 篇

import os
import importlib.util

# 获取当前工作目录
current_directory = os.getcwd()

# 构建utils文件夹的绝对路径
utils_directory = os.path.abspath('utils')

# 遍历utils文件夹下的所有.py文件
for file in os.listdir(utils_directory):
    if file.endswith('.py'):
        module_name = os.path.splitext(file)[0]  # 去除文件扩展名.py
        module_path = os.path.join(utils_directory, file)
        
        # 使用importlib动态导入模块
        spec = importlib.util.spec_from_file_location(module_name, module_path)
        module = importlib.util.module_from_spec(spec)
        spec.loader.exec_module(module)
        
        # 将模块导入当前命名空间
        globals()[module_name] = module