机器学习记录(二)

学习目标:

  • 一周掌握基本知识

学习内容:

  1. pandas库的时间日期高效操作 .dt.
    示例代码
sales_data['order_date'].dt.year

例子
在这里插入图片描述
dt.year能直接提取出年份,而且是整数型。

在这里插入图片描述
同样还可以提取月、日
在这里插入图片描述
在这里插入图片描述

  1. groupby

在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。
在Pandas中,上述的数据处理操作主要运用groupby完成。

总结来说,groupby的过程就是将原有的DataFrame按照groupby的字段(这里是company),划分为若干个分组DataFrame,被分为多少个组就有多少个分组DataFrame
参考链接

  1. apply

Pandas数据处理三板斧——map、apply、applymap详解

  1. reset_index()

reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=‘’)

在这里插入图片描述
示例

在这里插入图片描述
5.seaborn: hue用来分类
在这里插入图片描述
使用hue来分类后
在这里插入图片描述
6.Python数据可视化-seaborn库之countplot

countplot是seaborn库中分类图的一种,作用是使用条形显示每个分箱器中的观察计数。

sns.countplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, dodge=True, ax=None, **kwargs)

在这里插入图片描述
在这里插入图片描述


学习时间:

  • 周日下午 6点-下午 8 点

学习产出:

  • CSDN 技术博客 1 篇
import os
import importlib.util

# 获取当前工作目录
current_directory = os.getcwd()

# 构建utils文件夹的绝对路径
utils_directory = os.path.abspath('utils')

# 遍历utils文件夹下的所有.py文件
for file in os.listdir(utils_directory):
    if file.endswith('.py'):
        module_name = os.path.splitext(file)[0]  # 去除文件扩展名.py
        module_path = os.path.join(utils_directory, file)
        
        # 使用importlib动态导入模块
        spec = importlib.util.spec_from_file_location(module_name, module_path)
        module = importlib.util.module_from_spec(spec)
        spec.loader.exec_module(module)
        
        # 将模块导入当前命名空间
        globals()[module_name] = module


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值