- 博客(7)
- 收藏
- 关注
原创 今日学习项目一:数据清洗难点
1. 明确清洗目标:先确定数据用途,聚焦核心问题(如缺失值、重复值、异常值、格式不统一等)。2. 分步拆解流程:按“检查数据→处理问题→验证结果”的步骤推进,避免混乱。3. 借助工具简化:用Excel函数(如VLOOKUP、条件格式)、Python库(Pandas)或SQL语句批量处理重复、缺失等共性问题。4. 记录清洗规则:把处理逻辑(如缺失值填充方式、异常值判定标准)整理成文档,方便复盘和复用。数据清洗操作复杂、耗时,易出现遗漏或错误。
2025-10-09 23:47:35
298
原创 Python模块和包知识点
模:一个以 .py 为后缀的 Python 代码文件,包含变量、函数、类等,可被其他程序导入使用,实现代码复用。包:一个包含 __init__.py 文件的文件夹,用于组织多个相关模块,形成层级结构,避免模块名冲突。导入模块中的指定内容: from 模块名 import 函数名/类名/变量名 ,使用时可直接调用。导入模块并自定义别名: import 模块名 as 别名 ,简化调用。直接导入整个模块: import 模块名 ,使用时需加模块名前。在文件夹内添加多个 .py 模块文件。
2025-09-22 22:14:34
224
原创 今日学习之函数
可变参数:用 *args (接收多个位置参数,存为元组)或 **kwargs (接收多个关键字参数,存为字典),适合参数数量不确定的场景。基本语法:用 def 关键字声明,括号内写参数,冒号后写函数体, return 指定返回值(无则默认返回 None )。关键字参数:用“参数名=值”的形式传入,可打乱顺序(如 add(b=5, a=3) ,结果仍为8)。位置参数:必须按顺序传入,数量与定义时一致(如上面的 add(3,5) ,3对应a,5对应b)。2. 返回值(函数的“输出”)
2025-09-18 21:51:12
186
原创 元组与字典相关知识点总结
常用方法:仅2个内置方法, t.count(元素) (统计元素出现次数)、 t.index(元素) (返回元素第一次出现的索引,元素不存在则报错)。键(key)的规则:必须是不可变类型(如整数、字符串、元组),且唯一(重复键会覆盖前值);删除键值对: del d[key] (key不存在则报错)、 d.pop(key, 默认值) (删除并返回value,key不存在则返回默认值)。访问值: d[key] (key不存在则报错)、 d.get(key, 默认值) (key不存在时返回默认值,默认值可选)。
2025-09-17 22:01:13
223
原创 今日份学习(内容太多,没完全消化)
列表用方括号 [ ] 表示,元素用逗号分隔列表。可以包含任意数据类型(数字、字符串、其他列表等)列表元素按特定顺序排列,允许重复。pop(): 删除末尾元素(可指定索引)remove(): 删除指定内容的元素。list(str): 字符串转列表。len(list): 元素个数。max(list): 最大值。min(list): 最小值。通过索引直接赋值修改。
2025-09-16 22:24:06
246
原创 今日学习之for、break,continue
总行数为n时,第i行“”数量为n - i + 1),再通过前置空格(数量为i - 1)调整位置,空格与“*”输出后换行,形成右直角三角形。每一行星的数量等于当前的行数,空格数量不用去刻意写出。第1行1个、第2行2个……第n行n个,每行结束后换行,自然形成左直角三角形。使用for函数,可以打印出正方体或长方体m行n列的"*"九九乘法表(这个最难的,没有理清楚逻辑)打印m行n列的"*"
2025-09-15 22:06:56
141
原创 Python 7天体验
今天看了他们讲软约的7个同学,在他们身上也看到了自己存在的问题,努力提升自己。这几个我感觉已经懂啦,今天的雷老板出的题基本能有思路并且写出,已消化80%这个一开始感觉听懂了,后面做题的时候完全不一样了,希望明天可以多讲一下。今天复习了 if elif else。今天新学的 while 循环。
2025-09-11 21:13:25
101
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅