机器学习
chaosjey li
这个作者很懒,什么都没留下…
展开
-
基于《机器学习-Python实践》学习笔记——评估算法
1. 分离训练数据集和评估数据集通常以67%作为训练集,33%作为测试集。采用sklearn中的函数进行划分:train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。格式:X_train, X_test, y_train, y_test = train_test_split(train_data,train_target,test_size=0.3, random_state=0)参数解释:train_data:被划分的样原创 2020-12-15 15:03:36 · 222 阅读 · 0 评论 -
利用Python对数据进行PCA降维
PCA算法原理各本书中都有,具体推导也不用放了,就简单说一下步骤:对变量进行标准化操作;计算协方差矩阵;求协方差矩阵特征值与特征向量;将特征值从大到小排序,选择做大的前k个特征值对应的特征向量;将原始数据乘这k个特征向量,将其转化到对应的k维空间中。例1:对Iris数据集进行pca降维。iris莺尾花数据集导入后为(150, 5)的矩阵,共5类数据,每类150个样本。分别为’Sepal.Length’, ‘Sepal.Width’, ‘Petal.Length’, ‘Petal.Widt原创 2020-12-14 00:46:01 · 4219 阅读 · 2 评论 -
基于《机器学习-Python实践》学习笔记——数据准备和特征选取
数据预处理数据格式化先用fit()函数准备数据转换的参数,再用transform函数进行预处理。fit(): 简单来说,就是求得训练集X的均值,方差,最大值,最小值,这些训练集X固有的属性。transform(): 在fit的基础上,进行标准化,降维,归一化等操作(看具体用的是哪个工具,如PCA,StandardScaler等)。fit_transform(): fit_transform是fit和transform的组合,既包括了训练又包含了转换。transform()和fit_trans原创 2020-12-13 18:51:57 · 133 阅读 · 0 评论 -
基于《机器学习-Python实践》学习笔记——数据导入与基本处理
数据导入数据常以CSV格式储存,一般有三种导入方式:标准Python库reader函数:raeder处理文件中以逗号分隔的第一行数据,并将每一个数据作为一个元素存储在列表中。from csv import readerimport numpy as np# 使用标准的Python类库导入CSV数据filename = 'pima_data.csv'with open(filename, 'rt') as raw_data: readers = reader(raw_data, d原创 2020-12-13 15:03:20 · 227 阅读 · 0 评论 -
基于《机器学习-Python实践》学习笔记 4SciPy 速成
NumPy 速成数组生成一位数组(行向量)和多维数组(矩阵)import numpy as npm = np.array([1, 2, 3])print(m)print(m.shape)m = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])print(m)print(m.shape)访问第1行:m[0]访问第1列:m[:, 0]向量加法:m1+m2向量乘法:m1*m2 #注意行列对应Pandas速成Series:一位数组与一维原创 2020-12-12 21:21:20 · 138 阅读 · 2 评论 -
基于《机器学习-Python实践》学习笔记 3第一个机器学习项目
第三章 第一个机器学习项目共进行了五步导入数据概述数据# 导入类库from pandas import read_csvfrom pandas.plotting import scatter_matrixfrom matplotlib import pyplotfrom sklearn.model_selection import train_test_splitfrom sklearn.model_selection import KFoldfrom sklearn.model_s原创 2020-12-12 19:52:18 · 106 阅读 · 0 评论 -
基于《Python机器学习》学习笔记-感知器学习
感知器算法是一个简单的二分算法,相当于signoid函数的应用?具体原理参考下文:感知器学习以下代码来自书中2.2节,付我的注释理解:1. 定义感知算法eta:即η\etaη ,学习率n_iter: 初始迭代次数random_state:随机生成的权重import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapclass原创 2020-12-12 16:00:32 · 229 阅读 · 0 评论 -
Open CV学习
学习记录学习原因是一门课程的考核要求:实现5*5的字符识别,建议使用C语言。头文件#include <opencv2/opencv.hpp>调用OpenCV函数,需要在每个函数前加上cv::为了避免,使用using namespace cv;函数cv::imread()//依据文件名来决定载入图像格式cv::Mat//自带结构cv::namewindow//屏幕上打开窗口...原创 2020-10-11 00:11:55 · 374 阅读 · 0 评论 -
个人的LATEX入门笔记
插入公式:用xFormula输入后拷贝至latex换行: \空格:\行内插入公式符号:$ 符号公式 $行间插入公式符号:$$ 符号公示 $ $(两个符号间无空格)原创 2020-09-22 20:37:18 · 324 阅读 · 0 评论