- 博客(28)
- 收藏
- 关注
原创 Task 02 文本语言与循环神经网络
一. 文本预处理处理步骤:读入文本分词建立字典,将每个不同的词映射到唯一的索引将文本从词的序列转换为索引的序列二. 语言模型原理: 根据n元语法处理步骤:读取数据集建立字符索引时序数据采样随机采样相邻采样三. 循环神经网络如下图所示, 每个时间步形成一个模型进行计算, 可以得出每个时间步的模型参数...
2020-02-16 17:12:20 181
原创 Task 01 学习笔记
1. 线性回归针对其中不懂的梯度下降进行了解,获知了梯度是函数值上升最快的方向,该方向反之则下降最快,所以取名叫梯度下降算法参考: https://blog.csdn.net/weixin_42398658/article/details/830179952. softmax和分类模型softmax与常规的逻辑回归有所不同,它是通过线性回归算得不同类别的值,然后选择值最大的作为分类依据。...
2020-02-14 16:45:15 204
原创 基于vim-plug安装YCM
基于vim-plug安装YCM一. 注意事项1.1 安装vim8一. vim-plug1.1 安装1.2 使用二. YCM2.1 安装依赖库2.2 安装本体2.3 编译2.4 配置一. 注意事项确保你拥有支持Python 2或Python 3的Vim 7.4.1578以上版本如果版本不对,可以直接卸载vim(https://blog.csdn.net/wycgi/article/de...
2019-03-09 22:35:23 5690 2
原创 vim-卸载
vim-卸载卸载方法1. 查看有哪些与vim相关的软件2. 彻底删除这些软件卸载方法1. 查看有哪些与vim相关的软件dpkg -l | grep vim一般来说,可能包括vim,vim-runtime,vim-tiny,vim-common2. 彻底删除这些软件sudo apt-get remove vimsudo apt-get remove vim-runtimesudo ...
2019-03-09 18:52:46 2330
原创 MySQL与Python
MySQL与Python交互一. 准备数据二. SQL演练1. 基本查询2. 创建"商品分类"表(拆表)3. 同步分类表数据4. 创建"商品品牌"表5. 同步品牌表数据6. 修改表结构7. 外键三. Python操作MySQL1. 操作流程2. 引入模块3. 查询数据3. 增删改数据4. 防止SQL注入一. 准备数据-- 创建 "京东" 数据库create database jing_don...
2019-02-21 02:00:25 5998 3
原创 Python之背包问题
背包问题1.、问题描述1.1、0-1背包问题1.1.1、动态规划1.2、132. Palindrome Partitioning II1.、问题描述假设我们有n件物品,分别编号为1, 2…n。其中编号为i的物品价值为vi,它的重量为wi。为了简化问题,假定价值和重量都是整数值。现在,假设我们有一个背包,它能够承载的重量是W。现在,我们希望往包里装这些物品,使得包里装的物品价值最大化,那么我...
2018-12-24 15:21:35 10904
原创 Python之列表解析
列表解析作用及语法Leetcode应用作用及语法根据已有列表高效创建列表语法:[expression for iter_val in iterable]expression 指的是表达式,表达式中应对iter_val进行操作for iter_val in iterable的意思是,将列表iterable中的元素一一取出为iter_val最终各个iter_val经过express...
2018-12-23 16:57:49 752
原创 Python之递归与动态规划
Python之递归与动态规划一、递归二、动态规划三、总结一、递归递归(Recursion):函数调用自己。递归算法解决问题的特点:递归就是方法里调用自身。在使用递增归策略时,必须有一个明确的递归结束条件,称为递归出口。递归算法解题通常显得很简洁,但递归算法解题的运行效率较低。所以一般不提倡用递归算法设计程序。在递归调用的过程当中系统为每一层的返回点、局部量等开辟了栈来存储。递归次数过...
2018-12-22 21:27:41 466
原创 Python之二叉树
二叉树复习队列与堆二叉树定义遍历Python中应用leetcode复习队列与堆队列的操作比较讨巧,查找最大值或最小值的效率也较高,堆用于查最大值也是效率很高主要应掌握出队入队,以及出堆,Python中的deque模块与heapq模块能够分别建立队列和堆二叉树定义一棵深度为k,且有2^k-1个节点的二叉树,称为满二叉树。这种树的特点是每一层上的节点数都是最大节点数。而在一棵二叉树中...
2018-12-21 21:22:35 547
原创 Python之队列和堆
队列和堆一、复习1.1、哈希表1.2、链表二、队列2.2、定义2.2、leetcode应用三、堆3.1、定义3.2、Python中常用用法3.3、leetcode应用一、复习1.1、哈希表总结:在上次练习中,最大的感受是方便快捷。把数据存储到哈希表中,可以快速查找重复的,也可以直接取出想要的数据,时间复杂度低,以空间换时间1.2、链表总结:链表灵活性很强,可以双向,也可以循环,最重...
2018-12-20 18:52:49 659
原创 Python之链表
链表定义Python中的实例leetcode的应用142. Linked List Cycle II定义链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成。每个结点包括两个部分:一个是存储数据元素的数据域,另一个是存储下一个结点地址的指针域。 相比于线性表顺序结构,...
2018-12-19 14:21:38 262
原创 Python之哈希表
哈希表一、定义二、冲突三、Python中的应用3.1 字典一、定义散列表(Hash table,也叫哈希表),是根据关键码值(Key和value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键...
2018-12-18 13:06:38 61214 7
原创 机器学习11:应用之图片字符识别
应用之图片字符识别问题简介及解决流程滑动窗口行人检测文本检测字符分割识别单个字符上限分析问题简介及解决流程问题如上图,如何从图片中识别出若干文字信息。解决流程:文本检测(将有文字的部分整块截图)2. 字符分割(将截图分割成单个字符的图)3. 识别分割出来的图中的字符以上三个流程可分别安排团队成员(1-5个)进行处理滑动窗口行人检测先指定一定的长宽比(...
2018-12-13 12:00:35 885
原创 机器学习10:大规模数据学习
大规模数据学习大规模数据集学习随机梯度下降小批量梯度下降随机梯度下降的收敛在线学习映射约减大规模数据集学习得数据者得天下,一般而言,在进行机器学习时,比较好的情况时拥有大量的数据以及高方差(过拟合)的模型。在处理大量数据前,可以利用之前在另一篇博文中提到的学习曲线,查看模型是高偏差还是高方差,确定是高方差后再处理大量数据:随机梯度下降原梯度下降(批量(Batch)梯度下降)过程:如...
2018-12-12 20:33:16 457
原创 机器学习9.5:推荐系统
推荐系统参数基于内容的推荐参数nun_unu表示用户数量nmn_mnm表示电影数量r(i,j)r(i,j)r(i,j)表示用户j是否有评价电影i,若是,则值为1y(i,j)y(i,j)y(i,j)表示用户j对电影i的评分基于内容的推荐$$...
2018-12-12 15:59:41 201
原创 机器学习9:异常检测
异常检测起因高斯分布算法过程评估算法好坏异常检测和监督学习如何选择特征多元高斯分布起因例如:一个飞机引擎,它具有:功率、振动强度等特征。在生产时,怎么自动判断一个飞机引擎是好是坏。这需要用到正常的飞机引擎的样本集合(每个样本包括n个特征),再通过该样本集合判断待检测的飞机引擎是否不正常。如上图,通过p(x)p(x)p(x)进行判断,当p(x)≥ϵp(x)\ge \epsilonp(x)...
2018-12-10 21:43:15 372
原创 机器学习8:集群
集群算法非监督学习K-均值算法优化目标随机初始化集群中心点选取集群中心点数量K非监督学习如下图所示,,非监督学习是把相距较近的点划分为K个簇具体可以应用于市场分割、社交网络分析、组织计算集群和天文数据分析K-均值算法输入:需要划分的集群数量K,以及训练集{x(1),x(2),…,x(m)}\{x^{(1)},x^{(2)},\dots,x^{(m)}\}{x(1),x(2),…,x(m...
2018-12-10 17:56:57 1163
原创 Python之列表
列表输入输入#!/usr/bin/python# Filename: using_list.py# This is my shopping listshoplist = ['apple', 'mango', 'carrot', 'banana'] # 新建列表print 'I have', len(shoplist),'items to purchase.'print 'Th...
2018-12-07 12:48:44 127
原创 Python之运算
运算浮点数运算方法一 round方法二 math方法三 decimal浮点数运算如果直接进行浮点数运算,则可能会产生下列后果:>>> x=2.1>>> y=4.03>>> x+y6.130000000000001
2018-12-01 14:44:51 325
原创 机器学习7:SVM(支持向量机)
支持向量机优化目标大间距分类器数学原理优化目标对于逻辑回归的假设函数而言,在y=1的情况下,我们希望假设函数约等于1,且z远大于0;在y=0的情况下,我们希望假设函数约等于0,且z远小于0。对于支持向量机,则希望在y=1的情况下,z大于等于0,;在y=0的情况下,z取其他值(小于0)对于逻辑回归的代价函数,其中的loghθ(x)logh_\theta(x)loghθ(x)替代...
2018-12-01 12:15:05 218
原创 机器学习6:评估
评估评估模型(假设函数)训练集+测试集测试集的误差训练集+验证集+测试集诊断:偏差 vs 方差诊断后的调整评估神经网络过拟合/欠拟合平衡偏差和方差评估模型(假设函数)当要对我们的预测误差作故障排除,不外乎通过以下这几种方式:增加更多的训练样本减少特征种类增加特征种类(增加额外的特征或者多项式特征(x1x2,x12,x22)(x_1x_2,x_1^2,x_2^2)(x1x2,x12...
2018-11-23 18:46:12 332
原创 机器学习第5周
神经网络代价函数定义变量表示式子反向传播(重点)代价函数的偏导数原理剖析代价函数定义变量L是神经网络的总层数sls_lsl为第lll层的单元数量(不包括偏置单元)K为输出层的单元数量/分类类型数量表示式子神经网络的代价函数是正则化逻辑回归的代价函数的概括:J(θ)=−1m∑i=1m∑k=1K[yk(i)log(hθ(x(i))k)+(1−yk(i))log(1−hθ(x(...
2018-11-19 23:14:10 277
原创 机器学习第4周
神经网络背景-非线性假设的缺陷神经元和大脑模型展示1模型展示2直观例子1直观例子2多元分类背景-非线性假设的缺陷特征量增加过快非线性处理拥有多个特征的数据集是非常棘手的,如果将输入特征变为二次,如:将x1、x2、x3x_1、x_2、x_3x1、x2、x3变为x12、x22、x32、x1x2、x1x3、x2x3x_1^2、x_2^2、x_3^2、x_1x_2、x_1x_3、x_2x_...
2018-11-15 13:59:40 184
原创 机器学习第三周(下): 过拟合与正则化
拟合1、拟合程度1.1、过拟合1.1.1、原因1.1.2、理论解决方法1.1.3、实际解决方法之一:正则化1.1.3.1、正则化线性回归1.1.3.2、正则化正规方程法1.1.3.3、正则化逻辑回归1、拟合程度对于线性回归:对于逻辑回归:左图欠拟合,高偏差。中图正合适。右图过拟合,高方差。1.1、过拟合1.1.1、原因由上面的右图可知,特征太多(线性回归中四个特征:xxx、...
2018-11-13 22:44:25 307
原创 机器学习第3周(上)
监督学习之分类问题1、定义2、模型设置2.1、背景2.2、逻辑回归模型2.2.1、假设函数(模型)2.2.2、代价函数2.2.3、梯度下降2.2.4、软件自带的高级优化算法2.3、多元分类处理1、定义常见的二元分类如下:邮件:垃圾邮件/非垃圾邮件网络交易:欺诈/非欺诈癌症:恶性/良性多元分类如下:将邮件分类为:工作、家人、朋友等气候分类为:晴天、阴天、下雨、下雪等...
2018-11-12 21:34:34 209 2
原创 机器学习第二周(下)
目录Octave基操,勿6运算赋值列出数值向量和矩阵移动数据尺寸加载数据索引组合计算数据初始化计算矩阵Octave基操,勿6运算5+63-25*81/22^61 == 2 %等于, false 逻辑值,01 ~= 2 %不等于, true. 逻辑值,1 note, not "!="1 &amp
2018-11-11 17:38:17 1663
原创 机器学习第二周(上)
目录线性回归多元线性回归训练集假设函数代价函数特征缩放和均值归一化背景具体实现选择学习速率$\alpha$慎重选择特征合理选择模型(假设函数)正规方程法用途求解思路与梯度下降相比较潜在的不可逆性线性回归多元线性回归训练集面积卧室数量层数年份价格21045145460141632402321534323031585221...
2018-11-08 21:37:57 189
原创 机器学习第一周
目录机器学习定义分类监督学习非监督学习关于回归问题中的线性回归算法单变量线性回归算法一些背景知识矩阵与向量机器学习定义Arthur Samuel (1959)定义机器学习为:不用明确编程,给予计算机学习能力的领域(Machine Learning: Field ofstudy that gives computers the ability to learnwithout being ex...
2018-11-06 20:09:12 311
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人