机器学习笔记
进击的小白菜
愿再回首有迹可循~
展开
-
#机器学习笔记#PCA降维
**PCA:**可以对原数据进行简化,并且有效的找出数据中最“主要”的元素和结构,去除噪声和冗余,将原有的复杂数据降维。具有简单且无参数限制的优点,可以利用在各个场合步骤:1、读取绿萝的数据,将txt文件的内容转化成23073x6的矩阵形式保存在Data中。2、对样本进行中心化操作3、得到新的数据,求协方差矩阵:4、计算协方差矩阵的特征值和特征向量5、对特征值进行排序并保留需要的N个主...原创 2019-05-30 16:56:03 · 306 阅读 · 0 评论 -
#numpy练习题
z.max() #最大值z.min() #最小值z.mean()#平均值np.pad(z, pad_width=1, mode ='constant', constant_values=0)Z = np.diag(1+np.arange(4), k=1) #k为偏移量,k=-1,表示斜对角线的下方,k=1,表示斜对角线的上方,k=0,无偏移1、创建10*10随机矩阵,并找出最大和最...原创 2019-06-26 14:21:56 · 1091 阅读 · 0 评论 -
#数据分析与机器学习笔记#泰坦救援问题实现
1、数据预处2、使用线性回归进行分类3、使用逻辑回归进行分类4、使用随机森林进行分类5、改变数据策略6、使用集成算法进行分类7、遇到的错误及修改方法1、数据预处理#读取数据titanic = pd.read_csv('titanic_train.csv')#print(titanic.describe())#发现年龄有缺失,但是年龄又是不可忽略的因素,所以,要对年龄进行填充...原创 2019-07-03 19:09:36 · 1067 阅读 · 0 评论 -
#数据分析与机器学习笔记# 逻辑回归与梯度下降的实现
#逻辑回归目标:建立分类器(求解出三个参数O1,O2,O3)设定阈值,根据阈值判断结果要完成的模块sigmoid:映射到函数的概率model:返回预测结果值cost:根据参数计算损失函数gradient:计算每个参数的梯度方向descent:进行参数更新accuracy:计算精度1、必备模块import numpy as npimport pandas as pd...原创 2019-06-30 22:57:03 · 162 阅读 · 0 评论 -
将文件夹内文件按照一定比例分为训练集和测试集
在训练自己模型的时候往往需要自己准备数据集,并将数据集按照一定比例随机分为训练集和测试集,一下是一个简单的脚本,可满足此需要原创 2019-08-07 20:36:03 · 3563 阅读 · 0 评论 -
caffe-ssd 安装+填坑+SSD的focal_loss实现(Ubuntu系统)
安装:1、安装依赖库:sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compilersudo apt-get install --no-install-recommends libboost-all-devsudo apt...原创 2019-08-12 20:42:11 · 1189 阅读 · 0 评论