- 博客(9)
- 资源 (6)
- 问答 (1)
- 收藏
- 关注
原创 Machine Learning Foundations: A Case Study Approach-Regression-Assignment: Predicting House Prices
Predicting house pricesIn this module, we focused on using regression to predict a continuous value (house prices) from features of the house (square feet of living space, number of bedrooms,…). We al
2016-06-26 21:07:43 3288
原创 Coursera机器学习-第十周-Large Scale Machine Learning
Gradient Descent with Large DatasetsLearning With Large Datasets 我们已经知道,得到一个高效的机器学习系统的最好的方式之一是,用一个低偏差(low bias)的学习算法,然后用很多数据来训练它。 下面是一个区分混淆词组的例子: 但是,大数据存在一个问题,当样本容量m=1,000时还行,但是当m=100,000,000呢?请看一下
2016-06-23 15:47:21 4836
原创 Machine Learning-Recommender Systems(推荐系统)
Predicting Movie Ratings Problem Formulation 推荐系统问题就是,给定这些数据,给定这些 r(i,j)r(i, j) 和y(i,j) y(i, j) 数值,然后浏览全部数据,关注所有没有电影评分的地方,并试图预测这些带问号的地方应该是什么数值。 Content Based Recommendations 对于每一部电影,我们都有一个特征向量来描述它
2016-06-21 15:25:57 2387
原创 Coursera机器学习-第九周-Anomaly Detection
Density EstimationProblem Motivation 所谓异常检测就是发现与大部分对象不同的对象,其实就是发现离群点,异常检测有时也称偏差检测,异常对象是相对罕见的。 应用:欺诈检测:主要通过检测异常行为来检测是否为盗刷他人信用卡。 入侵检测:检测入侵计算机系统的行为 医疗领域:检测人的健康是否异常 下面来看一个例子: x1x_1: 引擎运转时产生的热量 x2x_2
2016-06-18 13:57:12 5946 2
原创 Coursera机器学习-第七周-Support Vector Machine
Large Margin Classification 支持向量机(Support vector machine)通常用在机器学习 (Machine learning)。是一种监督式学习 (Supervised Learning)的方法,主要用在统计分类 (Classification)问题和回归分析 (Regression)问题上。支持向量机属于一般化线性分类器,也可以被认为是提克洛夫规范化(Ti
2016-06-13 10:24:40 6429 1
原创 Coursera机器学习-第八周-Unsupervised Learning(K-Means)
ClusteringUnsuperivised Learning:Intruduction 典型的Supervised Learning 有一组附标记(y(i)y^{(i)})的训练数据集, 我们想要找出决策边界,藉此区分开正(positive)或负(negative)标记数据。 Unsupervised Learning 我们面对的是一组无标记的训练数据,数据之间,不
2016-06-12 09:30:10 4190
原创 Machine Leanring-Principal Component Analysis(PCA)
Principal Component Analysis 方差:数据与平均数之差平方和的平均数。更多详见 Principal Component Analysis(PCA)是最常用的线性降维方法,它的目标是通过某种线性投影,将高维的数据映射到低维的空间中表示,并期望在所投影的维度上数据的方差最大,以此使用较少的数据维度,同时保留住较多的原数据点的特性。通俗的理解,如果把所有的点都映射到一起,那么几
2016-06-12 09:01:17 3108 1
翻译 HIVE VS HBASE区别
Pre_knowledge: ACID,指数据库事务正确执行的四个基本要素的缩写。包含:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。一个支持事务(Transaction)的数据库,必需要具有这四种特性,否则在事务过程(Transaction processing)当中无法保证数据的正确性,交易过程极可能达不到交易方的
2016-06-06 10:48:28 604
原创 Coursera机器学习-第六周-Advice for Applying Machine Learning
Evaluating a Learning Algorithm Desciding What to Try Next Evaluating a Hypothesis Model Selection and Train/Validation/Test sets Bias vs. Variance Diagnosing Bias vs. Variance
2016-06-01 07:58:34 4351
Washington Machine Learning_slider_PPT
2016-06-26
web页面如何实现跨域跳转问题
2018-03-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人