机器学习与数据分析
骨骼惊奇不信邪
fine.
展开
-
机器学习python练习(1)线性回归
https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html实例参考文章:https://towardsdatascience.com/a-beginners-guide-to-linear-regression-in-python-with-scikit-learn-83...原创 2019-11-13 21:25:17 · 834 阅读 · 0 评论 -
机器学习课程笔记(第六周)机器学习建议
课程链接:https://www.coursera.org/learn/machine-learning推荐参考文章:https://www.cnblogs.com/maxiaodoubao/p/10076049.html1. 如何调试一个机器学习算法1)获得更多训练数据2)尝试更多/更少特征3)尝试添加多项式特征4)增大/减少 λ机器学习诊断法 Machine learni...原创 2019-11-11 21:05:08 · 361 阅读 · 0 评论 -
机器学习课程笔记(第十一周)图片文字识别
课程链接:https://www.coursera.org/learn/machine-learning参考文章:https://www.cnblogs.com/maxiaodoubao/p/10222391.html应用实例:Photo OCR实现照片OCR的机器学习流水线(machine learning pipeline)1. 文字检测:首先我们可以通览图像并找出有文字的图像区域...原创 2019-11-08 00:43:08 · 244 阅读 · 0 评论 -
机器学习课程笔记(第十周)大规模机器学习
课程链接https://www.coursera.org/learn/machine-learning参考文章https://www.cnblogs.com/maxiaodoubao/p/10222170.html大规模机器学习 Large Scale Machine Learning用来处理大数据的算法大数据集的学习 Learning With Large Datasets如...原创 2019-11-07 23:54:03 · 185 阅读 · 0 评论 -
机器学习课程笔记(第九周-2)推荐系统
课程链接:https://www.coursera.org/learn/machine-learning参考文章:https://www.cnblogs.com/maxiaodoubao/p/10220632.html推荐系统 Recommender Systems问题形式化 Problem Formulation例子引入:电影评分定义n: 特征变量数,图中有两个特征变量。x1...原创 2019-11-07 20:08:33 · 134 阅读 · 0 评论 -
机器学习课程笔记(第九周-1)异常检测
课程链接:https://www.coursera.org/learn/machine-learning参考文章:https://www.cnblogs.com/maxiaodoubao/p/10220292.html异常检测 Anomaly detection-----机器学习的常见应用训练出的模型,需要能够根据 xtest的位置告诉我们其属于一组数据的可能性 p(xtest)。...原创 2019-11-06 20:36:06 · 197 阅读 · 0 评论 -
机器学习课程笔记(第八周-2)降维问题 主成分分析法PCA
课程链接https://www.coursera.org/learn/machine-learning部分内容整理摘自https://www.cnblogs.com/maxiaodoubao/p/10217672.html维数约简dimensionality reduction原因:1.数据压缩 Data Compression数据压缩不仅通过压缩数据使得数据,占用更少的计算机内存和...原创 2019-11-05 20:02:47 · 1065 阅读 · 0 评论 -
机器学习课程笔记(第八周-1)K-means
非监督学习unsupervised learning聚类ClusteringK-means算法:步骤1:簇分配:遍历所有样本,把与聚类中心接近的点划为一类;步骤2:移动聚类中心:把聚类中心移动到和它同类的数据集的均值处。迭代以上两步骤,直到聚类中心和点集不再变化。两个输入:K(想聚类处的簇的个数);只有x没有标签y的训练集。x(i)是n维向量。算法表示:如果存在一个没有点分配...原创 2019-11-04 20:08:40 · 151 阅读 · 0 评论 -
机器学习课程笔记(第七周)支持向量机SVM
课程链接https://www.coursera.org/learn/machine-learning参考内容https://www.cnblogs.com/maxiaodoubao/p/10213597.html这一节学习的不是很认真,主要靠看以上博客内容。本文仅供自己学习记录,建议移步以上链接写的更好。SVM支持向量机逻辑回归回顾代价函数如下:构建SVM逻辑回归...原创 2019-11-05 20:28:29 · 198 阅读 · 0 评论 -
机器学习课程笔记(第五周)神经网络:学习
课程链接https://www.coursera.org/learn/machine-learning为了最小化J(θ),需要代码计算J(θ)和其偏导用到反向传播算法:梯度检验:随机初始化:搭建神经网络的步骤:1.搭建网络大体框架(1)确定输入单元数目:特征集x对应的输入单元数目(2)确定输出单元数目:分类问题中所要区分的类别个数确定(注意:如果多元分类问题y的取值范围1-1...原创 2019-10-29 21:38:31 · 133 阅读 · 0 评论 -
机器学习课程笔记(第四周)神经网络
课程链接https://www.coursera.org/learn/machine-learning第 j 层的第 i 个神经元激励activation:是指由一个具体神经元读入、计算并输出的值。一个波矩阵,控制着从一层到另一层的作用。g 是逻辑激励函数...原创 2019-10-28 19:26:50 · 125 阅读 · 0 评论 -
机器学习课程笔记(第三周)逻辑回归
课程链接https://www.coursera.org/learn/machine-learning逻辑函数"Sigmoid Function," also called the "Logistic Function":逻辑回归logistic regression成本函数cost function与线性回归不一样:成本函数的简化:梯度下降Gradient Descent这个算法与线性回归...原创 2019-10-23 22:34:16 · 86 阅读 · 0 评论 -
机器学习课程笔记(第二周)多元线性回归及一些Octave命令
机器学习课程链接:https://www.coursera.org/learn/machine-learning第二周多元线性回归multivariate linear regression多个特征量Multiple Featuresn: 特征量的数目,(有多少列不同的特征)m: 样本的数量,(有多少行数据): 第i个训练样本第i个训练样本的第j个特征量多特征的hypoth...原创 2019-10-21 22:37:16 · 328 阅读 · 0 评论 -
机器学习课程笔记(第一周)机器学习与线性回归
机器学习课程链接:https://www.coursera.org/learn/machine-learning第一周 机器学习与线性回归机器学习:一个计算机程序从经验E中学习某些类型的任务T,以及性能度量P,它在T任务中的表现,以P来衡量,随着经验E而改善。例如:E =下棋的经验;T=下棋的任务;P =程序赢得下一场比赛的概率。一、任何机器学习内容都可以分为两大类:监督学习Supe...原创 2019-10-17 22:54:02 · 227 阅读 · 0 评论 -
机器学习主要概念
内容摘自https://en.wikipedia.org/wiki/Machine_learning机器学习Machine Learning机器学习任务分类: 监督学习supervised learning 从一组包含输入input和期望的输出desire output 的数据集data set中建立数学模型mathematical model,训练集training data...原创 2019-10-15 20:57:24 · 191 阅读 · 0 评论 -
Machine Learning for Data Analysis(4) k-Means Cluster Analysis
I am using Python 3.7, Windows 10, Anaconda.The data set tree_addhealth.csvand the code arefrom the courseMachine Learning for Data Analysishttps://www.coursera.org/learn/machine-learning-data-a...原创 2019-10-10 22:40:02 · 243 阅读 · 0 评论 -
Machine Learning for Data Analysis(3) Lasso Regression Model套索回归
I am using Python 3.7, Windows 10, Anaconda.The data set tree_addhealth.csvand the code arefrom the courseMachine Learning for Data Analysishttps://www.coursera.org/learn/machine-learning-data-an...原创 2019-10-09 23:28:44 · 379 阅读 · 0 评论 -
Machine Learning for Data Analysis(2)Building a Random Forest with Python 随机森林
I am using Python 3.7, Windows 10, Anaconda.The data set tree_addhealth.csvand the code arefrom the courseMachine Learning for Data Analysishttps://www.coursera.org/learn/machine-learning-data-an...原创 2019-10-08 22:20:34 · 170 阅读 · 0 评论 -
Machine Learning for Data Analysis(1)Running a Classification Tree决策树
I am using Python 3.7, Windows 10, Anaconda.The data set tree_addhealth.csv is from the courseMachine Learning for Data Analysishttps://www.coursera.org/learn/machine-learning-data-analysisInstal...原创 2019-10-08 20:50:19 · 213 阅读 · 0 评论