![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AI学习之路
枸杞柠檬茶
行走在人生路上,笑看风起云涌,观四路八方,心中自有春秋。
一点点改变,一点点不一样,改变自己,世界因你变得不一样,蜕变的人生,正在上演,问我何以然也,只道一句:有所得,必有所失;有可为,有可不为!
展开
-
机器学习读书笔记-5(决策树)
决策树1.1 基本概念决策树(decision tree)是一类常见的机器学习方法,又称判定树。在分类任务中,通过一系列的“子决策”来最终确定样本所属类别。决策过程从上到下类似于树结构,例如判断是不是好瓜的例子:决策过程中提出的每一个问题都是对样本某一个属性的“测试”,每个测试结果或是导出最终结论,或是导出进一步的判定问题,其考虑范围是在上次决策结果的限定范围之内。一般的,一颗决策树包含一个根节点、若干个内部结点和若干个叶子结点;叶子结点对应决策结果,其他每个结点对应于一个属性的测试。从根节点到每一原创 2020-08-02 19:13:46 · 625 阅读 · 0 评论 -
机器学习读书笔记-1(模型评估与选择)
1、基础关键词错误率:分类错误的样本数占样本总数的比例。精度:1 - 错误率误差:模型的实际预测输出与样本的真实输出之间的差异。训练误差、经验误差:模型在训练集上的误差。泛化误差:模型在新的样本数据上的误差。过拟合:模型在训练集上的效果逐渐上升,而在测试集上的效果逐渐下降,这种现象在机器学习中称为过拟合。过拟合是由多种因素导致的,其中最常见的情况是由于学习能力过于强大,以致于学习到了训练样本的非一般的特性。过拟合是机器学习面临的关键障碍,各类算法都有一些针对过拟合的措施。不过要认识到,过拟合是无原创 2020-07-27 11:52:04 · 235 阅读 · 0 评论 -
机器学习读书笔记-2(模型性能度量)
对学习器的泛化性能进行评估,不仅需要有效可行实验评估方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量(performance measure)。1、错误率与精度错误率和精度是分类任务当中最常用的两种性能度量。错误率:精度:更一般的,对于数据分布D和概率密度函数p(),错误率和精度分别描述如下,2、查准率、查全率与F1值错误率和精度虽然常用,但是不适用与所有的任务需求。例如,“挑选出来的信息有多少是用户感兴趣的”,“用户感兴趣的信息有多少挑选出来了”,这两种问题就不适用于错误率和精原创 2020-07-27 17:37:59 · 329 阅读 · 0 评论 -
机器学习读书笔记-4(多分类学习与类别不平衡问题)
1 多分类学习现实中常常遇到的是多分类的学习任务,有些二分类的学习方法可以直接推广到多分类,在更多情况下,我们是基于一些基本策略,利用二分类学习器来解决多分类问题。下面介绍三种最经典的策略。1.1 “一对一”(one vs one, 简称OvO)OvO将这N个类别进行两两配对,从而产生N(N-1)/2 个二分类任务,通过训练将得到N(N-1)/2 个二分类模型。在测试阶段,新样本将同时提交到所有的二分类模型当中,从而得到N(N-1)/2 个分类结果,最终的结果可以通过投票决策产生。分类示意图如下图原创 2020-07-31 14:32:15 · 1513 阅读 · 0 评论 -
机器学习读书笔记-3(线性模型)
1 线性模型1.1 线性模型的基本形式线性模型(linear model)就是试图学得一个通过属性的线性组合来进行预测的函数,即一般用向量形式写成:其中的,x1,x2,…,等表示多个属性值;其中的w1,w2,…,等表示对应属性的权值,类似于表示该属性值对应的重要性;其中b表示线性函数的一个偏移量,w和b刚开始都是先赋值一些初始值,然后通过模型训练,逐渐修改w和b的数值,以得到一个较为合适的数值,得到较好的预测效果。1.2 线性回归我们首先先介绍一个在只有一个属性的数据集当中,讲解线性回归的原原创 2020-07-30 15:29:10 · 613 阅读 · 0 评论 -
解决centos7虚拟机无法上网的问题
(是我在在线安装wget的时候,发现无法安装,然后发现原来是虚拟机没法上网的问题,因此在网上找了很多方法,终于可以了。)网上的方法我也都试过了,下面说一下一般的设置centos虚拟机网络的步骤。1、在虚拟机网络编辑器当中设置NAT模式之所以设置这个模式,是因为一般情况下我们本地主机的IP和虚拟机的IP不在一个网段上,因此使用这个NAT模型,可以让不在同一个网段上也可以共享网络。2、修改ifcfg-ens33文件首先,先从第一步中记住NAT模式下的虚拟机的子网IP,子网掩码,网关IP等信息,然后进入原创 2020-07-03 14:03:01 · 478 阅读 · 0 评论 -
第一学习在情绪分析比赛中使用Paddlehub
这篇博客主要是记录一下第一次学习使用Paddlehub来进行情感分析。(备注:这里的代码是参考一个比赛大佬的baseline,如果有侵权的话,可以联系我,我会删除引用的code的。)1.数据处理该比赛原本的数据是采用GB2312编码,如果用平常的读.csv文件的方法可能行不通,所以我们可以先通过将数据文件的编码格式转换为通常的utf-8格式。通过写一个函数,函数的功能无非是读文件,然后写文件,...原创 2020-04-05 23:13:35 · 1404 阅读 · 1 评论 -
深度学习中的注意力机制(2017版)
深度学习中的注意力机制(2017版) 原创 ...转载 2020-02-13 17:06:29 · 512 阅读 · 0 评论 -
注意力模型详细解析
前言attentio...转载 2020-02-13 17:00:12 · 1290 阅读 · 0 评论 -
天池大赛 > 【新人赛】工业蒸汽量预测建模算法
题目连接立即进入代码:# -*- coding: utf-8 -*-"""Created on Tue Dec 12 14:48:01 2018@author: 李帅超"""import numpy as npimport pandas as pdimport seaborn as snsimport ma原创 2018-12-19 11:25:16 · 3266 阅读 · 1 评论 -
机器学习笔记(更新)
*** 2018.12.17 ***(1)pandas.read_table() 可以用来读取.txt类型的dataframe文件(2)忽视运行结果的警告:import warningswarnings.filterwarnings('ignore')(3)热力图import seabornimport matplotlib.pyplot as plt# 找出相关程度pl...原创 2018-12-19 21:30:53 · 248 阅读 · 0 评论 -
训练赛-汽车行业用户观点主题及情感识别
赛题通道(进入)闲聊:这是我第三次参加大数据比赛,也是第一次接触大数据比赛的自然语言处理,下面吧现在的代码写成博客保存一下,代码还在不断优化中。。。正题:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport jieba #利用结巴分词功能进行有效的分词import re ...原创 2018-12-04 09:36:09 · 2145 阅读 · 15 评论 -
感知机模型无法表示异或(异或线性不可分)
https://www.zybuluo.com/ArrowLLL/note/827264“>感知机详细理论转载 2018-08-13 17:31:21 · 3943 阅读 · 2 评论 -
二项分布
话不多说,先上图原创 2018-08-11 16:41:58 · 3594 阅读 · 0 评论 -
矩阵特征值的求解过程
这几天一直在学习机器学习相关的算法,真心感受到了高数,概率论,线性代数用作用之大,也深深的感受到了自己当时学的太肤浅了,仅仅是为了考试而学习的。。。。。(如果有来生,没有来生了。。。。)...原创 2018-08-11 14:14:35 · 15493 阅读 · 0 评论 -
二分迭代求解函数
这个和牛顿迭代方法功能类似,都是求解函数的一个根 话不多说,上图片 下面的那个函数测试,该函数有两个根,下面的运行结果只得到了一个,该方法也就是只能一次得到一个根...原创 2018-08-10 21:41:43 · 1192 阅读 · 0 评论 -
牛顿迭代求解函数根的方法
这是今天学习的第一个知识点,很是兴奋虽然有点少,但是还是想写一篇博客来把它记录下来。 这个是牛顿迭代公式,好像一个来求解一个函数根的近似值得方法,但是需要给出这个函数以及该函数的一次导数,在随机给出一个随机的初值x0,然后通过控制迭代次数,和迭代结果的精确度,就可以得到该函数的近似解 接下来测试了一个有两个根的一元二次方程 从上面的几次简单的测试和理论方法可以大概得知,这个牛...原创 2018-08-10 20:31:06 · 2677 阅读 · 0 评论 -
高斯分布(正态分布)
今天学习了个高斯分布的实现过程,这个高斯分布呢,在概率论上面就已经学到过了,不过我记得当时我们老师主要讲的是正太分布,我才知道高斯分布个正太分布是一样的呀(可能我的概率论白学了。。。) ...原创 2018-08-14 09:43:41 · 5611 阅读 · 0 评论 -
AI成长之梦(梦想的开始) 一
我现在是一名大二即将大三的学生,本科的专业是软件工程,上的学校是一所普通的二本院校(现在是一本了)。刚上大学的时候,由于一些原因,没有打算要考研的,但是呢家里面的亲戚朋友们都想让我越往上上越好,但是我觉得他们那些所谓的考研很用的想法,根本不具有普遍性,而且我也觉得,考研需要看个人的一写因素,和所学的专业,不能盲目的跟风吧!感觉从小到大,我们小的时候可能根本没有想过我们为什么要上学,也许父母告诉...原创 2018-08-10 13:06:41 · 338 阅读 · 0 评论