5.13y打卡

最新推荐文章于 2025-05-13 21:22:14 发布

丁值心

最新推荐文章于 2025-05-13 21:22:14 发布

阅读量442

点赞数 15

分类专栏：机器学习小白从0到1 文章标签：机器学习人工智能 python 开发语言支持向量机

本文链接：https://blog.csdn.net/2403_89678402/article/details/147919221

版权

机器学习小白从0到1 专栏收录该内容

24 篇文章

订阅专栏

@浙大疏锦行

DAY 24 元组和OS模块

知识点回顾：

1. 元组

2. 可迭代对象

3. os模块

作业：对自己电脑的不同文件夹利用今天学到的知识操作下，理解下os路径。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
from sklearn.metrics import accuracy_score
# 1. 加载数据
iris = load_iris()
X = iris.data
y = iris.target
# 2. 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 3. 构建管道
# 管道按顺序执行以下步骤：
#    - StandardScaler(): 标准化数据（移除均值并缩放到单位方差）
#    - LogisticRegression(): 逻辑回归分类器
pipeline = Pipeline([
    ('scaler', StandardScaler()),
    ('logreg', LogisticRegression())
])
# 4. 训练模型
pipeline.fit(X_train, y_train)
# 5. 预测
y_pred = pipeline.predict(X_test)
# 6. 评估模型
accuracy = accuracy_score(y_test, y_pred)
print(f"模型在测试集上的准确率: {accuracy:.2f}")
import os
# os是系统内置模块，无需安装
os.getcwd() # get current working directory 获取当前工作目录的绝对路径
os.listdir() # list directory 获取当前工作目录下的文件列表
#    我们使用 r'' 原始字符串，这样就不需要写双反斜杠 \\，因为\会涉及到转义问题
path_a = r'C:\Users\YourUsername\Documents' # r''这个写法是写给python解释器看，他只会读取引号内的内容，不用在意r的存在会不会影响拼接
path_b = 'MyProjectData'
file = 'results.csv'
# 使用 os.path.join 将它们安全地拼接起来，os.path.join 会自动使用 Windows 的反斜杠 '\' 作为分隔符
file_path = os.path.join(path_a , path_b, file)
# os.environ 表现得像一个字典，包含所有的环境变量
os.environ
# 使用 .items() 方法可以方便地同时获取变量名（键）和变量值，之前已经提过字典的items()方法，可以取出来键和值
# os.environ是可迭代对象
for variable_name, value in os.environ.items():
    # 直接打印出变量名和对应的值
    print(f"{variable_name}={value}")
# 你也可以选择性地打印总数
print(f"\n--- 总共检测到 {len(os.environ)} 个环境变量 ---")
start_directory = os.getcwd() # 假设这个目录在当前工作目录下
print(f"--- 开始遍历目录: {start_directory} ---")
for dirpath, dirnames, filenames in os.walk(start_directory):
    print(f"  当前访问目录 (dirpath): {dirpath}")
    print(f"  子目录列表 (dirnames): {dirnames}")
    print(f"  文件列表 (filenames): {filenames}")
    # # 你可以在这里对文件进行操作，比如打印完整路径
    # print("    文件完整路径:")
    # for filename in filenames:
    #     full_path = os.path.join(dirpath, filename)
    #     print(f"      - {full_path}")