机器学习
谁陪你落日流年
这个作者很懒,什么都没留下…
展开
-
Python机器学习应用 | 【第一周】无监督学习
本周课程导学1.无监督学习简介利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习。• 有监督学习和无监督学习的最大区别在于数据是否有标签• 无监督学习最常应用的场景是聚类(clustering)和降维(DimensionReduction)聚类和分类都是无监督学习的典型任务,任务之...转载 2018-08-20 10:33:50 · 5019 阅读 · 0 评论 -
《Machine Learning in Action》| 第2章 k-近邻算法
准备:使用 Python 导入数据"""@函数说明: 创建数据集"""def createDataSet(): # 四组二维特征 group = np.array([[3,104],[2,100],[101,10],[99,5]]) # 四组特征的标签 labels = ['爱情片','爱情片','动作片','动作片'] return原创 2018-10-15 19:20:33 · 228 阅读 · 1 评论 -
《Machine Learning in Action》| 第4章 基于概率论的分类方法:朴素贝叶斯
使用Python进行文本分类准备数据:从文本中构建词向量程序清单 4-1 词表到向量的转换函数def loadDataSet(): # 将构造的文档切分成词条 postingList = [['my','dog','has','flea','problems','help','please'], ['maybe','not','take'...原创 2018-09-21 11:42:12 · 327 阅读 · 0 评论 -
”达观杯”文本智能处理——逻辑回归应用
sklearn中一般使用CountVectorizer和TfidfVectorizer这两个类来提取文本特征 CountVectorizer() [词频统计把文本特征处理成数字向量] vectorizer = CountVectorizer(ngram_range=(1,2), min_df=3, max_df=0.9, max_features=100000) 参数说明: ngra...原创 2018-09-03 11:47:00 · 518 阅读 · 0 评论 -
《Machine Learning in Action》| 第5章 Logistic回归
绘制数据集图像# -*- coding: utf-8 -*-import numpy as npimport matplotlib.pyplot as plt"&quot原创 2018-09-15 17:04:02 · 285 阅读 · 2 评论 -
Kaggle——Titanic罹难乘客预测
import pandas as pd#读取数据集train = pd.read_csv(r'D:\dataset\Titanic\train.csv')test = pd.read_csv(r'D:\dataset\Titanic\test.csv')print(train.info()) # 先分别输出一下测试集与数据集的基本信息print(test.info())print...原创 2018-08-28 19:56:12 · 317 阅读 · 0 评论 -
矩阵求导问题
先上图,最全面的公式 结论和推广 就向上面那样,我们可以得出几个向量偏导公式:标量对向量的导数 如果 y = xT·A·x的话,y对向量x求偏导的结果是 如果这时A有时对称阵,则: PS:xT·A·x其实是一个标量,也就是一个数。标量对方阵的导数(补充)...原创 2018-08-24 10:40:53 · 156 阅读 · 0 评论 -
Python机器学习应用 | 【第二周】监督学习
本周课程导学监督学习的目标利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映射关系应用到未知数据上,达到分类或回归的目的。分类:当输出是离散的,学习任务为分类任务。回归:当输出是连续的,学习任务为回归任务。分类学习• 输入:一组有标签的训练数据(也称观察和评估),标签...转载 2018-08-20 10:36:53 · 1110 阅读 · 0 评论 -
《Machine Learning in Action》| 第3章 决策树
决策树决策树的一般流程(1) 收集数据:可以使用任何方法。(2) 准备数据:树构造算法只适用于标称型数据,因此数值型数据必须离散化。(3) 分析数据:可以使用任何方法,构造树完成之后,我们应该检查图形是否符合预期。(4) 训练算法:构造树的数据结构。(5) 测试算法:使用经验树计算错误率。(6) 使用算法:此步骤可以适用于任何监督学习算法,而使用决策树可以更好地理解数据的内在含义。...原创 2018-10-27 19:13:04 · 333 阅读 · 0 评论