Machine Learning
文章平均质量分 66
roguesir
非、典型算法攻城狮
展开
-
【ML Note】机器学习中的 bias & variance
机器学习模型中的误差主要分为两个部分:bias和variance,一般情况下,模型需要在bias和variance之间取得一个平衡。bias小的模型,variance一般大;variance小的模型,bias一般大。更好的理解bias和variance的关系能够帮助我们更好的应付模型的过拟合和欠拟合问题。BiasBias表示的就是模型预测的值和真实值之间的距离的期望。所以我们会通过建立多个模型(如使用不同的数据子集)来估计这个误差期望值。Bias代表着算法的拟合能力。偏差大的模型,它通常不怎么从训练原创 2021-06-01 16:22:16 · 597 阅读 · 0 评论 -
Liblinear机器学习库教程详解(基于Python API)
前言Liblinear机器学习库主要实现SVM算法,在处理大规模数据时速度快,但也有缺点,就是太吃内存,博客 https://blog.csdn.net/roguesir/article/details/79793569 中介绍了在Mac Python3环境下安装,这篇博客介绍使用教程。数据集要求liblinear与libsvm类似,都要求使用libsvm格式数据,下面用库自带的hea...原创 2021-04-11 21:34:44 · 585 阅读 · 0 评论 -
Liblinear机器学习库教程详解(基于Python API)
前言Liblinear机器学习库主要实现SVM算法,在处理大规模数据时速度快,但也有缺点,就是太吃内存,博客 https://blog.csdn.net/roguesir/article/details/79793569 中介绍了在Mac Python3环境下安装,这篇博客介绍使用教程。以下材料自己整理,有错误请指出。数据集要求liblinear与libsvm类似,都要求使用libsv...原创 2018-04-03 21:30:20 · 4852 阅读 · 3 评论 -
【Python】Mac Python安装liblinear机器学习库
前言今天刚接触这个软件包,估计未来几天都会和它打交道了,会把相关的代码整理出来,持续更新。安装liblinear是一个简单的求解大规模规则化线性分类和回归的软件包。它最讨人喜欢的特点就是速度快,和libsvm一样,都是由台大Chih-Jen Lin开发的,提供了多种编程语言API,下面简介安装流程。 下载 官网:http://www.csie.ntu.edu.tw/~cjlin...原创 2018-04-02 19:07:21 · 2897 阅读 · 0 评论 -
Paper-Reading
论文笔记,涉及计算机视觉、推荐算法等原创 2018-03-20 19:50:35 · 1363 阅读 · 0 评论 -
【ML算法】监督学习——逻辑回归
前言挺久没更新博客了,满是愧疚,最近一直在鼓捣数据,感觉没什么可写的,于是翻出之前没有完成的机器学习算法,继续完善~概述逻辑回归(Logistic Regression,LR),虽然叫回归,但实际上是一种分类算法,主要处理二分类问题,LR模型简单,但应用非常广,很多公司都是应用LR解决工业界问题,因为简单,模型生成后,处理速度快,可以满足工业需求。 逻辑回归的主要用途: (1)解决...原创 2018-03-19 19:42:52 · 1806 阅读 · 0 评论 -
Resource-Sharing(更新中)
更新时间:2018/04/25前言从开始接触数据挖掘、机器学习、深度学习,到现在积累了不少资料,一点点整理分享出来,书和论文会放在百度云盘里,有需要的自己下载哈!这段时间比较忙,更新频率不会特别快~ Github链接:https://github.com/roguesir ,欢迎Fork或Star哈^_^Resource SharingDeep Learning...原创 2018-03-17 23:51:25 · 1158 阅读 · 0 评论 -
【Tensorflow】Python实现神经网络回归
环境macOS,python3.6,tensorflow1.1.0回归问题 年份 事故起数 死亡人数 受伤人数 直接财产损失(万元) 2003 80 3 50 11 2004 90 8 70 12.5 2005 180 20 120 20 2006 140 16 9...原创 2018-02-27 00:02:02 · 10921 阅读 · 10 评论 -
【Trick】机器学习特征工程处理(一)
前言机器学习特征工程处理系列博客为博主学习相关视频教程以及结合平时接触到的特征工程处理方法,总结出的一些处理技巧,本篇博客介绍数据格式化、数据清洗、数据采样等,我在之前有总结过一篇博客介绍数据预处理的常用方法,对其中的部分操作有涉及,如有需要,可参考本篇博客。数据格式化存储格式(一)时间戳/时间段/时间记录标准 对于同类属性,比如时间属性,表达形式不同,但要采取同样的记录原创 2018-01-27 21:32:21 · 1342 阅读 · 0 评论 -
博客目录
R语言学习笔记R实现机器学习R机器学习(一)——一元回归R机器学习(二)——非线性回归R机器学习(三)——多元回归R机器学习(四)——logistics回归R机器学习(五)——决策树ID3算法R机器学习(六)——决策树C4.5算法R机器学习(七)——回归树CART算法R机器学习(八)——K-means聚类R机器学习(九)——层次聚类R机器学习(十)——密度聚类DBSCANR机器学习(十一)——Ap...原创 2017-09-04 20:41:40 · 2112 阅读 · 0 评论 -
【scikit-learn】机器学习(四)——逻辑回归
前言这一系列文章将介绍各种机器学习算法,部分算法涉及公示推导,我的博客中有另一个板块介绍基于python和R实现各种机器学习算法,详情见置顶的目录,这篇文章将介绍逻辑回归。算法介绍逻辑回归(Logistic Regression),是一种分类算法,常用与解决而分类问题,也可以多个模型组合解决多分类问题。...原创 2018-01-10 20:05:46 · 542 阅读 · 0 评论 -
【ML算法】监督学习——线性回归
前言这一系列文章将介绍各种机器学习算法,部分算法涉及公示推导,我的博客中有另一个板块介绍基于python和R实现各种机器学习算法,详情见置顶的目录,这篇文章将介绍线性回归。算法介绍线性回归(Linear Regression),说白了就是高中时候学的一元拟合,相对简单的一种表达如下: ŷ =θ0+θ1x1+θ2x2+⋯+θnxny^=θ0+θ1x1+θ2x2+⋯+θn...原创 2017-11-26 15:02:59 · 1225 阅读 · 0 评论 -
【ML算法】监督学习——支持向量机
### 前言这一系列文章将介绍各种机器学习算法,部分算法涉及公示推导,我的博客中另有板块介绍基于python和R实现各种机器学习算法,详情见置顶的目录。本文介绍支持向量机。我的GitHub上面也会有详细介绍,地址为:https://github.com/roguesir.### 算法介绍支持向量机(Support Vector Machine,SVM),是一种杰出的机器学习算法,...原创 2017-11-28 21:36:42 · 1390 阅读 · 0 评论 -
【Paper Note】基于情感分析和关系网络的影视产品评论数据文本挖掘研究
摘要[目的]为了挖掘观众对影视产品的主观感受,建立合适的模型评估影视产品的质量。 [方法]本文通过对web影视作品评论数据建立评估模型,通过LDA和关系网络进行分析研究,并将结果与影视作品的网站评分做比较,从而得到较为准确的分析结果。[结果]对影视作品的评论数据进行文本挖掘分析,能够得到观众的主观情感评分,更加客观地反映影视作品的质量高低。[结论] 模型对于主观性强的评论数据具有较为可信的评估...原创 2018-04-19 15:09:59 · 5541 阅读 · 0 评论 -
博客目录
博客目录原创 2018-04-24 17:52:17 · 1458 阅读 · 3 评论 -
博客目录——R语言学习笔记
更新日期:2018/04/24R实现机器学习R机器学习(一)——一元回归 R机器学习(二)——非线性回归 R机器学习(三)——多元回归 R机器学习(四)——logistics回归 R机器学习(五)——决策树ID3算法 R机器学习(六)——决策树C4.5算法 R机器学习(七)——回归树CART算法 R机器学习(八)——K-means聚类 R机器学习(九)——层次聚类 R...原创 2018-04-24 17:58:07 · 923 阅读 · 0 评论 -
【ML算法】集成学习——LightGBM的Python实现
前言LightGBM算法作为Kaggle竞赛的热门算法,具有速度快、精度高、可并行等特点,本文实现了LightGBM算法的简单实现。代码# coding: utf-8import jsonimport lightgbm as lgbimport pandas as pdfrom sklearn.metrics import mean_squared_error# load...原创 2018-08-10 15:23:43 · 4135 阅读 · 0 评论 -
【DL笔记】Tutorial on Variational AutoEncoder——中文版(更新中)
摘要近三年来,变分自编码(VAE)作为一种无监督学习复杂分布的方法受到人们关注,VAE因其基于标准函数近似(神经网络)而吸引人,并且可以通过随机梯度下降进行训练。VAE已经在许多生成复杂数据包括手写字体[1,2]、人脸图像[1,3,4]、住宅编码[5,6]、CIFAR图像[6]、物理模型场景[4]、分割[7]以及预测静态图像[8]上显现优势。本教程介绍VAE背后的灵感和数学解释,以及一些实...原创 2018-07-31 20:13:10 · 2062 阅读 · 1 评论 -
【DL笔记】Tutorial on Variational AutoEncoder——中英文对照(更新中)
AbstractIn just three years, Variational Autoencoders (VAEs) have emerged as one of the most popular approaches to unsupervised learning of complicated distributions. VAEs are appealing because ...原创 2018-07-31 20:03:47 · 3854 阅读 · 0 评论 -
【DL笔记】变分自编码——VAE详解
前言作为一个坚守9年的V迷,谈VAE还是很兴奋的,虽然这次谈的是Variational AutoEncoder(变分自编码)。这几年,深度学习中的无监督学习越来越受到关注,其中以GAN和VAE最受欢迎,之前有介绍过AE(AutoEncoder)的详解一、详解二和AE实现,本文介绍变分自编码——VAE。 注:之前的名为VAE详解的半成品没有用markdown,编辑公式比较麻烦,索性copy过来...原创 2018-07-28 17:40:48 · 14307 阅读 · 2 评论 -
【ML Method】熵、联合熵、条件熵、互信息、相对熵、交叉熵
更新时间:2018-07-07前言之前有写过一篇文章介绍信息增益、Gini、信息增益率的,上面介绍过熵及其相关概念,地址为:https://blog.csdn.net/roguesir/article/details/76619919。这篇文章从另外的角度详细介绍熵、联合熵、条件熵、互信息、相对熵、交叉熵、信息增益等信息,为后面介绍最大熵模型做铺垫。下面进行详细介绍: 熵的概...原创 2018-07-07 00:02:19 · 1837 阅读 · 0 评论 -
【DL笔记】AutoEncoder详解(二)
前言之前写过一篇博客介绍AutoEncoder,主要侧重理解(点击这里),这篇博客主要介绍AutoEncoder的算法层面及常见的AE算法。欠完备自编码器(Undercomplete AutoEncoder)AutoEncoder(自编码器,AE)是神经网络的一种,基本结构分为编码、解码过程,即找到随机映射 f=pencoder(h|x)f=pencoder(h|x)f=p_{en...原创 2018-07-24 14:16:20 · 2944 阅读 · 0 评论 -
博客目录——ML&DL项目
更新时间:2018/04/24ML项目【ML项目】基于决策树算法的电信运营商客户流失预测 【ML项目】基于聚类算法的我国临终关怀现状分析 【ML项目】基于情感分析和关系网络的影视产品文本挖掘分析 【ML项目】基于网络爬虫和数据挖掘算法的web招聘数据分析(一)——数据获取及预处理 【ML项目】基于网络爬虫和数据挖掘算法的web招聘数据分析(二)——探索性数据分析 【ML项...原创 2018-04-24 18:23:44 · 891 阅读 · 0 评论 -
博客目录——推荐系统专题
更新时间:2018/05/01推荐系统——算法概述 推荐系统——冷启动问题 推荐系统——Factorization Machine 推荐系统——xDeepFM详解原创 2018-04-24 18:18:47 · 1025 阅读 · 0 评论 -
博客目录——Machine Learning算法学习
更新日期:2018/04/24方法技巧【Trick】核技巧 【Trick】决策树剪枝 【Trick】数据预处理的常用方法 【Trick】机器学习特征工程处理(一)异同【异同】信息增益、Gini、信息增益率 【异同】决策树ID3和C4.5的异同 【异同】LR和SVM的异同 【异同】梯度提升决策树和随机森林的异同算法学习【ML算法】监督学习——线性回归 【...原创 2018-07-24 17:05:49 · 513 阅读 · 0 评论 -
博客目录——Python学习笔记
更新日期:2018/04/24Python基础常用文件读取 Python2与Python3的不同 Python正则表达式 基于python的urllib库编写网络爬虫 人脸检测工具face_recognition的安装与使用 Mac安装图像标注工具LabelImg Mac Python安装liblinear机器学习库 用pip安装python库下载超时的解决办法 p...原创 2018-04-24 18:11:59 · 639 阅读 · 0 评论 -
【Trick】核技巧(kernel trick)
核技巧原创 2017-12-14 16:18:54 · 1773 阅读 · 0 评论 -
【ML算法】无监督学习——关联规则Apriori算法
前言这一系列文章将介绍各种机器学习算法原理,部分算法涉及公示推导,我的博客中另有板块介绍基于python和R实现各种机器学习算法,详情见置顶的目录。本文介绍Apriori。关联规则关联规则(Association Rules,AR),这种原理最初应用于购物篮发现,实际上就是从大量的已知购物信息中提取出具有关联性而人们平时又不会注意到的规则,像经典的啤酒与尿布、蛋挞与飓风的案例都是对...原创 2017-12-07 16:44:30 · 1029 阅读 · 0 评论 -
【R笔记】R机器学习(一)——一元回归模型
R机器学习(一)——一元回归模型原创 2017-09-22 23:47:56 · 1022 阅读 · 0 评论 -
【Paper Note】基于聚类算法的我国临终关怀现状分析
基于聚类算法的我国临终关怀现状分析原创 2017-08-28 21:55:55 · 4960 阅读 · 0 评论 -
【Paper Note】基于决策树算法的电信运营商客户流失预测
1.引言随着互联网业务的速发展,移动业务市场的客户流失预警成为每一个电信运营商重点关注的内容,在商务智能与机器学习快速发展的当下,运用数据挖掘的方法,实现对电信客户的挽留、转化、精准营销越来越彰显其商业价值。如何最大程度地挽留在网用户、吸取新客户,是电信企业最关注的问题之一。竞争对手的促销、公司资费软着陆措施的出台和政策法规的不断变化,影响了客户消费心理和消费行为,导致客户的流失特征不断发生变化。...原创 2017-06-24 10:43:32 · 18236 阅读 · 14 评论 -
【Paper Note】Convolutional Clustering for Unsupervised Learning 论文翻译
Convolutional Clustering for Unsupervised Learning 论文翻译翻译 2017-06-02 11:44:47 · 8282 阅读 · 0 评论 -
相似图片搜索算法介绍
相似图片搜索算法介绍原创 2017-08-21 15:16:14 · 13497 阅读 · 2 评论 -
【Python】基于python的urllib库编写网络爬虫
基于python的urllib库编写网络爬虫原创 2017-07-10 14:58:33 · 2183 阅读 · 0 评论 -
【ML笔记】决策树剪枝
决策树剪枝原创 2017-08-04 17:48:38 · 1814 阅读 · 0 评论 -
【ML笔记】信息增益、Gini、信息增益率
信息增益、Gini、信息增益率原创 2017-08-03 15:50:44 · 12347 阅读 · 1 评论 -
【ML笔记】梯度提升决策树(GBDT)和随机森林(RF)的异同
梯度提升决策树(GDBT)和随机森林(RF)的异同原创 2017-07-27 10:29:56 · 9266 阅读 · 0 评论 -
【Paper Note】Convolutional Clustering for Unsupervised Learning 论文理解
【Paper Note】Convolutional Clustering for Unsupervised Learning 论文理解原创 2017-07-12 17:20:10 · 2182 阅读 · 0 评论 -
【ML笔记】决策树ID3和C4.5算法的异同
决策树ID3和C4.5算法的异同原创 2017-08-01 08:56:27 · 6305 阅读 · 0 评论 -
【ML笔记】LR和SVM的异同
LR和SVM的异同原创 2017-07-27 10:38:59 · 2509 阅读 · 0 评论