- 博客(13)
- 资源 (1)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 回归算法学习笔记——线性回归、随机梯度(SGD、BGD)、逻辑回归(牛顿法)、Softmax回归算法、L1/L2正则化、Ridge、Lasso、ElasticNet
目录线性回归梯度下降算法构建损失函数梯度下降法Logistic Regression算法sigmoid函数构造目标函数构造损失函数-极大似然估计梯度下降多分类问题优化算法:牛顿法切线法另一种理解方式改进:拟牛顿法Softmax Regression算法Softmax回归代价函数L1/L2正则化L1L2L1和L2对比正则化目的Ridge与LassoElasticNet线性回归回归分析目标函数:线性回归方程 y=wx+by = wx + by=wx+b一个或多个自变量和因变量之间的关系进行建模(其中θ
2020-06-07 18:08:11
3251
5
原创 论文学习笔记——弱监督语义分割(Learning Integral Objects with Intra-Class Discriminator for Weakly-Supervised Sema)
目录基础概念CAM 与 ICD 的不同ICD效果展示基础概念Feature manifold(特征流形)流形是一种空间,一个流形好比是一个 m 维的数据在 d 维的空间上被扭曲的结果。其中(m > d)(一般维度压缩的方法中都会提到这个概念)上图中每张图片为同一张人脸的 64×64 的灰度图,如果按照列(或行)拼起来,就可以得到一个 4096 维的向量,这样一来,每一张图片就可以看成是 4096 维欧氏空间中的一个点。很显然,并不是 4096 维空间中任意一个点都可以对应于一张人脸图片的
2020-07-24 12:04:26
1743
2
原创 深度学习学习笔记——RNN(LSTM、GRU、双向RNN)
前置知识深度学习是什么深度学习是机器学习的一个分支由全连接网络、卷积神经网络和循环神经网络构成的结构多层全连接网络:多层感知器多层卷积神经网络卷积神经网络基本结构数据:2D输入数据形式:[批尺寸(batchsize),高度(H),宽度(W),通道数(特征数)(channel)],[B, H, W, C]2D卷积核心格式:[(卷积核心大小1,卷积核心大小2),输入通道数(特征),输出通道数(特征)]1D输入数据形式:[B, T, C]1D卷积核心格式:[K, C, C2]2
2020-07-05 16:58:07
1085
翻译 Reliability Does Matter: An End-to-End Weakly Supervised Semantic Segmentation Approach(AAAI 2020)
本文翻译了一篇关于弱监督语义分割论文,原文地址目录摘要介绍相关工作提出的方法概述分类分支:生成可靠区域的标签语义分割分支:进行预测实验数据集和实现细节分析我们的方法与先前方法的比较结论摘要弱监督语义分割是一项具有挑战性的任务,因为它仅将图像级信息作为训练的监督,但会生成像素级的预测以进行测试。为了解决这一艰巨的任务,最新的最新方法建议采用两步式解决方案,即1)学习生成伪像素级遮罩,以及2)利用FCN(全卷积网络)训练伪像素级别的遮罩的语义分割网络。但是,两步解决方案通常在生产高质量的伪蒙版时要花很多力
2020-07-02 17:36:55
1397
原创 练手项目——Click-Through Rate Prediction 逻辑回归
系统环境:操作系统:Windows 8.1 64-bitCPU:Intel i7-4200HQ 3.60GHzRAM:8GBGPU: GeForce GTX 970M (CUDA 10.1)目录读取数据File descriptions:Data fields:数据预处理特征离散/因子化训练小部分特征训练全特征训练选择部分特征标准化模型调参库环境:import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pl
2020-06-09 19:03:16
1402
4
原创 无监督机器学习学习笔记——极大似然估计、EM算法、聚类算法(K-means、DSCAN、层次聚类、AP)、降维(PCA、ICA、LDA)
目录条件概率的拓展极大似然估计EM(Expectation-Maximization)算法聚类算法K-means(约束簇)DSCAN(非约束簇)层次聚类(非约束簇)AP(非约束簇)总结矩阵降维稀疏自编码器PCA算法ICA算法字典学习线性判别分析(LDA)(与下文LDA有区别,但不常用)LDA(隐狄利克雷分配模型)条件概率的拓展极大似然估计试验1:抛硬币出现2正2反,求正面概率这里涉及到贝叶斯学派与频率学派理论频率学派认为其正面概率可以通过统计得到,也就是说世界是确定的,假设抛N次硬币有m个
2020-06-06 23:06:00
1704
3
原创 Creditcard_prediction_练手小项目
目录所需环境库以环境读取数据并显示数据各列信息设置训练集和测试集训练阶段所需环境库以环境import pandas as pdimport matplotlibimport matplotlib.pyplot as pltimport numpy as npimport sklearnprint('pandas:',pd.__version__)print('matplotlib:',matplotlib.__version__)print('numpy:',np.__version__
2020-06-05 15:23:21
488
1
原创 决策树_练手小项目
所需库环境import pandas as pdimport matplotlibimport matplotlib.pyplot as pltimport numpy as npimport sklearnprint('pandas:',pd.__version__)print('matplotlib:',matplotlib.__version__)print('numpy:',np.__version__)print('sklearn:',sklearn.__version__)
2020-06-05 15:19:30
333
原创 机器学习——分类器算法对比(KNN、SVM、朴素贝叶斯、随机森林、Adaboost)(学习笔记)
目录k邻近(KNN)基础算法实例优缺点代码实现支持向量机(SVM)基础算法对偶问题松弛变量核函数代码实现朴素贝叶斯算法基本算法优点代码实现过拟合(Over fitting)以及欠拟合(Under fitting)集成学习方差和偏差模型的偏差和方差是什么?bagging的偏差和方差boosting的偏差和方差模型的独立性算法对比k邻近(KNN)基础算法KNN是通过测量不同特征值之间的距离进行分类。它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,
2020-06-01 12:06:08
25743
原创 机器学习——决策树、随机森林(学习笔记)
笔记目录决策树基本流程划分选择1.ID3(信息增益):分类2.C4.5(信息增益比):分类3.CART(GINI系数):分类与回归剪枝算法预剪枝后剪枝随机森林基本流程Out of bag error (OOBE)优缺点boost算法Adaboost算法GBDT(Gradient Boosting Decision Tree)算法XGBoost集成学习BaggingBoostingStacking决策树基本流程决策树学习的目的是为了产生一颗泛化能力强,即处理未见示例能力强的决策树,其基本流程遵循简单且直
2020-05-30 17:22:16
634
原创 TensorFlow练手小项目
目录内容介绍读取数据绘制不同特征与对应标签的散点图,以及特征分标签处理搭建神经网络使用numpy进行预测内容介绍该项目需要实现一个分类问题,输入数据X有两个属性,标签d包含两类,用整形数字0、1表示。读取数据 homework.npz请分析点(0.2, 0.2)所属类别尽可能的提升精度与速度,在精度大于95%时,速度因素更加需要考虑可以使用多层神经网络可以进行特征工程使用TensorBoard绘制所搭建的网络模型尝试使用numpy完成预测读取数据import numpy as
2020-05-21 23:41:44
1076
原创 特征工程项目训练(iris 和 Titanic)
特征工程训练特征工程:特征排序:通过递归特征消除,获取鸢尾花数据集特征排名导入需求的库:from sklearn.feature_selection import RFEfrom sklearn.linear_model import LogisticRegressionfrom sklearn.datasets import load_irisimport warningswarnings.filterwarnings("ignore")读取数据:鸢尾花数据集iris = loa
2020-05-21 14:55:54
703
原创 机器学习中特征工程总结
特征工程目的构造更多质量好的特征特征工程思考流程1. 搜索查看数据列名:print(data_train.columns)查看数据每列信息(数目,空置和类型):print(data_train.info())查看每列统计信息(数目、均值、方差、最小值、25%分位值、50%分位值、75%分位值和最大值):print(data_train.describe())特征状况:类型:连续型(均值作为代表)、离散型(众数)int float object 等考虑是否需要进行离
2020-05-21 14:33:02
955
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人