python学习日记(机器学习篇)(windows系统)

这篇博客记录了在Windows系统中使用Python进行机器学习的步骤,重点是决策树算法。作者首先介绍了Jupyter Notebook的安装和使用,接着讲解了数据集的导入、基础的Pandas操作,以及数据清理。然后,通过一个简单的决策树模型展示了如何建立、训练和保存模型。最后提到了模型结果的可视化方法,但内容尚未完成。
摘要由CSDN通过智能技术生成

使用工具(这块不用看是我写给自己的 ):

常用工具:

numpy、Pandas、matPlotlib、Scikit-Learn

代码编写测试工具:

Jupyter(易于编写和测试)

Jupyter安装及使用:

下载anaconda(官网/清华源)
安装anaconda后,找到anaconda prompt终端,输入Jupyter notebook,跳转至路径,选择路径,单击New进行创建。创建后可自定义文件名:***.ipynb

jupyter界面1

数据集导入

下载数据集***.csv,方便起见,移动至之前创建的jupyter notebook所在文件夹
导入工具:pandas

import pandas as pd#使代码简洁化
df = pd.read_csv('database_name.csv')#读取数据集,返回一个数据框架(data frame)

常用基础方法和属性(参考pandas文档)

可参考:jupyter常用方法及属性

  1. shape(形状)
    返回数据集形状(如:(行数,列数))
df.shape
  1. describe(描述)
df.describe()

返回数值列的汇总统计信息,如最小值、最大值、标准差、平均值等信息

  1. value(值)
df.value

返回一个数组,用来描述数据集的所有值

  1. drop(删除)
    以删除列为例
X = df.drop(columns = ['column_name'])#删除名为columns_name的列

shortcuts

  1. 命令模式(代码块边框为蓝色)
    h:显示快捷键列表
    b:插入新代码块&#
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值