机器学习
文章平均质量分 80
Amy_mm
https://github.com/xuman-Amy
积跬步,至千里
展开
-
感知机学习总结 (一)
关于感知机学习的总结,虽然大多是书上内容,但是觉得写下来还是有意义的~~参考其他几篇博客,大致分为以下几个版块【感知机的数学模型】【感知机的几何意义】【感知机学习策略】【感知机学习算法实现——原始形式】【感知机学习算法实现——对偶形式】【感知机算法实现例题】【感知机模型的python实现】参考书籍 李航 -《统计学习方法》 《python machine le...原创 2018-03-19 11:43:15 · 1239 阅读 · 0 评论 -
逻辑回归模型(一)——数学模型
学习李航的《统计学习算法》,今天周三,这周任务之一完成逻辑回归模型的博文记录。逻辑回归(Logistic Regression)属于分类方法(classification)。逻辑回归与最大熵模型(maximum entropy)都属于对苏线性模型。【逻辑回归模型】【逻辑分布】X连续随机变量,服从逻辑分布是指:...原创 2018-03-29 17:41:16 · 5135 阅读 · 1 评论 -
混淆矩阵(confusion matrix)
git源码地址 https://github.com/xuman-Amy/Model-evaluation-and-Hypamameter-tuning数据地址 https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic)True positive (TP) :真实为P,预测为PTrue neg...原创 2018-04-12 10:23:38 · 7186 阅读 · 2 评论 -
机器学习——情感分析
《python machine learning》 chapter 8 Applying Machine Learning to Sentiment Analysisgit源码:https://github.com/xuman-Amy/sentimental-analysis项目说明:根据Internet Movie Database (IMDb)上获取的50000个影评,预测影评是积极的...原创 2018-04-18 11:29:24 · 4676 阅读 · 1 评论 -
HMM 实现中文词性标注 以及 维特比算法原理
原理:HMM 生成式模型,利用联合概率建模,估算隐藏于观测序列背后的隐序列。POS:单词:观测序列,词性:状态序列(隐序列)HMM建模公式:P(O)=∑QP(O,Q)=∑QP(O∣Q)P(Q)P(O) = \sum_{Q} P(O, Q) \\ = \sum_{Q} P(O| Q) P(Q) \\P(O)=Q∑P(O,Q)=Q∑P(O∣Q)P(Q)一阶马尔科夫假设...原创 2019-04-11 00:15:21 · 4038 阅读 · 1 评论 -
python 实现 Peceptron Learning Algorithm ( 二) 感知机模型实现
参考书籍 《python machine learning》对代码进行详细的注释,注释参考 《统计学习方法》 以及博客http://blog.csdn.net/zhq0808/article/details/68961329GIT源码:https://github.com/xuman-Amy/Perceptron_python代码如下:import numpy as n...原创 2018-03-21 21:13:53 · 732 阅读 · 0 评论 -
python 实现 Peceptron Learning Algorithm ( 三) 感知机模型应用于Iris数据集
参考 《python machine learning》代码读的很费劲,应该是没有功底的原因吧然后就挨个的百度不懂的函数,函数记录在了(一)中,链接为http://blog.csdn.net/Amy_mm/article/details/79625288Iris数据集 以及源码 可以在github上下载~~GIT: https://github.com/xuman-Amy/Pe...原创 2018-03-21 21:45:03 · 862 阅读 · 0 评论 -
python 实现 Peceptron Learning Algorithm ( 一) 几个函数的记录
【numpy.random.normal( )】对应于numpy中numpy.random.normal(loc=0.0, scale=1.0, size=None)参数的意义为:loc:float 此概率分布的均值(对应着整个分布的中心centre)scale:float 此概率分布的标准差(对应于...原创 2018-03-20 14:34:31 · 706 阅读 · 0 评论 -
EDA——数据可视化
matplot和seaborn实现数据可视化模块输入参数:dataframe文件或者文件地址,想要查看的类别字段,输出:图形三种类型:分析单变量、双变量和多个变量之间的关系建议的图形有在ppt里边说明matplot和seaborn的画图是参考的参考链接之后有加上echarts的图,发现比自己画的好看百倍。附上github的地址 eda github源码...原创 2019-04-03 12:53:31 · 1754 阅读 · 0 评论 -
CRF实现中文词性标注(1)——原理说明
写在前边po上看到的一个大佬的博文,这篇博客也是学习大佬的文章。文中图片也来自于参考博文。参考链接:CRF、有向图、无向图大佬的图模型大佬的CRF讲解我的知乎专栏,小白要努力了哦图模型背景Naive BayesP(X∣y)=p(x1∣y)p(x2∣y)....p(x3∣y)P(X|y) = p(x1|y)p(x2|y)....p(x3|y)P(X∣y)=p(x1∣y)p(...原创 2019-04-12 16:24:22 · 6130 阅读 · 1 评论 -
CRF实现词性标注(2)——python代码说明
CRF原理说明请查看上篇博文https://blog.csdn.net/Amy_mm/article/details/89219584参考链接同上篇博文定义CRF中的初始变量,包括特征函数, 特征函数的权重, 词性标注的label也就是状态序列,以及label_id字典。 def __init__(self, feature_functions, labels): ...原创 2019-04-15 14:38:13 · 3847 阅读 · 3 评论 -
模型评估和超参数调整(三)——学习曲线和验证曲线 learning curves and validation curves
读《python machine learning》chapt 6Learning Best Practices for Model Evaluation and Hyperparameter Tuning【主要内容】(1)获得对模型评估的无偏估计(2)诊断机器学习算法的常见问题(3)调整机器学习模型(4)使用不同的性能指标对评估预测模型git源码地址https:/...原创 2018-04-11 20:27:59 · 3381 阅读 · 0 评论 -
模型评估和超参数调整(二)——交叉验证 (cross validation)
读《python machine learning》chapt 6Learning Best Practices for Model Evaluation and Hyperparameter Tuning【主要内容】(1)获得对模型评估的无偏估计(2)诊断机器学习算法的常见问题(3)调整机器学习模型(4)使用不同的性能指标对评估预测模型git源码地址https:/...原创 2018-04-11 20:26:00 · 13205 阅读 · 5 评论 -
逻辑回归模型(二)——sklearn实现逻辑回归(logistic regression)
【Modeling class probabilities via logistic regression】 类概率的逻辑回归建模,事件发生的几率(odds)定义为 事件发生概率与事件未发生概率的比值。logit函数代表事件的几率,其中p代表我们所预测事件发生的概率。sigmoid 函数(S形函数) , 如下图sigmoid函数输入为全体实数,将输入转化为(0,1)...原创 2018-03-31 16:59:06 · 6028 阅读 · 0 评论 -
支持向量机——sklearn 实现支持向量机(SVM)
《Python machine learning》书籍学习~~~支持向量机的数学模型稍后补上,先来讲一下sklearn中的实现。Support Vector Machine(SVM) ,优化目标与感知机相反,感知机是实现错误的最小优化;SVM实现边缘最大优化。边缘(margin):两个分离差超平面之间的距离支持向量(support vector):距离分割超平面最近的训练样本点...原创 2018-04-01 16:58:50 · 2938 阅读 · 0 评论 -
Adaptive linear neurons model 线性神经元 运用梯度下降法 进行代价函数的最优化
Minimizing cost functions with gradient descent【梯度下降法】将平方误差的和作为代价函数J(w)(cost function) 利用梯度下降法最优化cost functionJ(w)对于w求偏导: = 所以 w更新为代码中即 : self.w_[1:] += self.eta...原创 2018-03-23 15:43:37 · 881 阅读 · 0 评论 -
最大熵模型——数学模型
【最大熵模型】【最大熵原理】不再赘述最大熵原理,简言之,最大熵原理认为所选择的模型必须满足约束条件,不确定的部分都认为是等可能的。利用熵的最大化实现等可能的表示。熵公式: 其中 , 表示X的取值个数,当且仅当X的分布式均匀分布时等号成立。即,X服从均匀分布时,熵最大。【最大熵模型的定义】最大熵模型,顾名思义就是将最大熵原理应用到分...原创 2018-04-02 21:24:15 · 405 阅读 · 0 评论 -
数据压缩之降维(一)——PCA降维
学习《python machine learning》chapter5——Compressing data via dimensionality reduction主要内容如下:(1)主要成分分析 Principal Component Analysis (PCA) ——非监督学习(2)线性判别分析 Linear Discriminant Analysis (LDA) ——监督学习...原创 2018-04-10 10:54:57 · 2089 阅读 · 0 评论 -
python数据预处理之缺失值简单处理,特征选择
书籍:《python machine learning》推荐kaggel 上大神的数据预处理文章:https://www.kaggle.com/pmarcelino/comprehensive-data-exploration-with-python自己之前也学习过这篇文章对一些代码进行了注释,博文如下:https://blog.csdn.net/Amy_mm/article...原创 2018-04-03 19:59:39 · 12573 阅读 · 0 评论 -
scikit-learn 学习总结 (一)——sklearn实现感知机(perceptron)
学习《python machine learning》 的第三章,A Tour of Machine Learning Classifiers Using scikit-learn本章主要讲述 特征选择 和 数据预处理,以下算法实现都是基于sklearn的接口~~~~生命不息,学习不止~ 哈哈哈哈【训练一个机器学习模型的五大关键步骤:】(1)选择特征,收集训练样本(2)选择性能...原创 2018-03-28 11:35:12 · 8716 阅读 · 0 评论 -
数据压缩之降维(二)——LDA
学习《python machine learning》chapter5——Compressing data via dimensionality reduction主要内容如下:(1)主要成分分析 Principal Component Analysis (PCA) ——非监督学习(2)线性判别分析 Linear Discriminant Analysis (LDA) ——监督学习...原创 2018-04-10 18:45:12 · 1004 阅读 · 0 评论 -
数据压缩之降维(三)——KPDA
学习《python machine learning》chapter5——Compressing data via dimensionality reductionPCA链接https://blog.csdn.net/Amy_mm/article/details/79812241主要内容如下:(1)主要成分分析 Principal Component Analysis (PCA) —...原创 2018-04-10 23:04:03 · 1436 阅读 · 0 评论 -
模型评估和超参数调整(一)——管道机制(pipeline)
读《python machine learning》chapt 6Learning Best Practices for Model Evaluation and Hyperparameter Tuning【主要内容】(1)获得对模型评估的无偏估计(2)诊断机器学习算法的常见问题(3)调整机器学习模型(4)使用不同的性能指标对评估预测模型git源码地址https:/...原创 2018-04-11 20:23:51 · 3525 阅读 · 0 评论 -
Kaggel House Price 数据预处理及其可视化
参考原文链接https://www.kaggle.com/pmarcelino/comprehensive-data-exploration-with-python数据预处理源码(详细注释)git 地址:https://github.com/xuman-Amy/kaggel引入要用的包import pandas as pdimport numpy as npimport m...原创 2018-03-13 11:51:07 · 3386 阅读 · 0 评论