自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 NLP-CS224n学习讲义PART 4——Dependency Parsing

1 依存语法和依存结构 NLP中的解析树与编译器中的解析树类似,用于分析句子的句法结构。主要有两个类型的结构——成分结构和依存结构。成分语法结构使用短语结构语法将单词组织成嵌套的成分。而我们主要关注的是依存结构解析。 句子的依存结构主要分析的是哪些词依赖于其他哪些词。这些单词之间的二元非对称关系称...

2020-06-12 10:48:05 65 0

原创 NLP-CS224n学习讲义PART 3——Neural Networks, Backpropagation

1 神经网络基础 从下面一张图我们可以知道为什么我们需要使用神经网络进行分类: 这张图显示了线性回归分类的局限性,也就是大部分的数据都不是线性可分的,所以我们需要非线性的分类器。而神经网络是一类具有非线性决策边界的分类器,如下图所示: 所以我们可以接下来主要学习神经网络的一些基础知识,很简单,...

2020-05-30 17:59:38 55 0

原创 NLP-CS224n学习讲义PART 2——Word Vector 2: GloVe, Evaluation and Training

NLP-CS224n学习讲义PART 2——Word Vector 2: GloVe, Evaluation and Training 1 Global Vectors for Word Representation(GloVe) 1.1 方法间的比较 我们之前提到两种查找词汇嵌入的方式。第一种就...

2020-05-30 17:54:24 43 0

原创 NLP-CS224n学习讲义PART 1——Word Vector 1: Introduction, SVD and Word2vec

1 介绍NLP 1.1 NLP有什么特别之处? 人类的语言是一个专门用来传达意思的系统,而不是由任何一种物质表现所产生的。在这方面,它与视觉或其他任何机器学习任务有很大区别。 大多数单词只是语言外实体的符号,而语言符号可以被编码成多种形式,比如声音、手势、文字等连续的信号。 1.2 NLP任务举例...

2020-05-06 17:33:15 53 0

原创 周志华《机器学习》(西瓜书)学习笔记——第八章集成学习

2019-12-31 15:23:46 83 1

原创 周志华《机器学习》(西瓜书)学习笔记——第七章贝叶斯分类器

2019-12-31 15:21:31 66 0

原创 周志华《机器学习》(西瓜书)学习笔记——第十章降维与度量学习

2019-12-31 15:20:27 77 0

原创 周志华《机器学习》(西瓜书)学习笔记——第九章聚类

2019-12-31 15:19:12 77 0

原创 周志华《机器学习》(西瓜书)学习笔记——第六章支持向量机

2019-12-31 15:17:45 68 0

原创 Git学习笔记(五)标签管理

1 创建标签 我们可以在git上打标签。首先切换到需要打标签的分支上,然后使用命令 git tag <name> 即可打标签,并可用 git tag 查看所有标签: 默认标签是打在最新提交的commit上的,若想在过去的提交上打标签则需要找到历史提交的commit id,然后打上标签...

2019-12-24 20:58:31 47 0

原创 Git学习笔记(四)分支管理

分支管理 创建与合并分支 我们知道Git把每次的提交都串成一条线性的时间线,这个时间线就是一个分支,我们当前的分支是 主分支即 master 分支,而 HEAD 指向的便是 master,即指向的是当前分支。 一开始,master分支是一条线,Git用master指向最新的提交,再用HEAD指向...

2019-12-18 21:47:42 37 0

原创 Git学习笔记(三)远程仓库

远程仓库 添加远程库 我们首先在github上添加我们电脑的SSH Key, 这样才能在本地将仓库push到github上。 然后我们在github上创建一个仓库,名字设为learngit,接着在本地learngit仓库下运行: 即将本地仓库与github上的仓库进行关联, 最后,在push上...

2019-12-18 21:47:05 24 0

原创 Git学习笔记(二)修改版本与回退

修改版本与回退 Git修改 我们修改一下readme.txt文件: 然后我们使用git status查看一下仓库的状态。 因为这个readme.txt受Git所管理,所以一旦修改之后,查看git仓库的状态就能显示出来修改记录(上图标红处),然后通过 git diff来查看修改前后的差异: 从...

2019-12-18 21:46:15 30 0

原创 Git学习笔记(一)介绍Git、创建版本库

本次Git系统学习主要来自廖雪峰的官方网站

2019-12-14 16:20:12 52 0

原创 NYOJ—水池数目(DFS)

描述: 校园里有一些小河和一些湖泊,现在,我们把它们通一看成水池,假设有一张我们学校的某处的地图,这个地图上仅标识了此处是否是水池,现在,你的任务来了,请用计算机算出该地图中共有几个水池。 输入: 第一行输入一个整数N,表示共有N组测试数据 每一组数据都是先输入该地图的行数m(0 <...

2019-11-21 16:00:17 236 0

原创 深度学习基础知识之正则化

背景知识 1 训练误差与泛化误差 训练误差,顾名思义,就是在训练集上表现出的误差,而后者是通过训练得到的模型在任意一个测试集上表现出的误差的期望,但通常直接通过测试集上的误差即(测试误差)来近似。 假设学习到的模型是 Y=f^(X)Y = \hat{f}(X)Y=f^​(X),则 训练误差 是模型...

2019-11-21 10:56:44 46 0

原创 Machine Learning——聚类(基本概念)

1、聚类任务 我们知道在无监督学习中,训练样本的标签是未知的,所以为了能够通过这些无标签的训练样本来探究数据的内在性质及其规律,便产生了许多无监督学习算法。 其中,我们若想要通过数据的内在性质来分类数据,那么出现了一种叫 “聚类” 的方法。 【 定义 】 聚类针对给定的样本,依据它们特征的相似度或...

2019-11-16 17:22:33 61 0

原创 Pytorch【60天修炼计划】之第二阶段——进阶:量化

以下内容主要来自于Pytorch官网Pytorch量化,特此记录学习过程。(其实更像直接翻译了一下,逃~ Quantization 量化 1、什么是量化? 量化是一种近来深度学习加速中快速发展的技术,它指的是以比浮点精度更低的比特宽度来执行计算并存储 Tensors 的技术。 一个量化的模型便采用...

2019-11-15 10:51:32 3387 0

原创 Flush Python

1. 内置序列类型概览 容器序列:list, tuple, collections.deque 扁平序列:str, bytes, bytearray, memoryview, array.array 容器序列存放的是它们所包含的任意类型的对象的引用,而扁平序列里存放的是值而不是引用 也可以按照...

2019-11-14 16:42:50 31 0

原创 Pytorch【60天修炼计划】之第二阶段——进阶:卷积神经网络之AlexNet

接着我们上一个经典的卷积神经网络LeNet,我们这一篇主要记录一下深度卷积神经网络中经典模型 AlexNet,从论文中可以找到其架构: input[ 3, 224 × 224 ] ( channels, weight * height) Conv2d[ 1, 96, 11 × 11, 4, 0...

2019-11-13 20:00:49 85 0

原创 分布式系统——Raft的实现

接上一个对于Raft的分析,这是文章的链接地址:https://blog.csdn.net/karry_zzj/article/details/102943617 我们这一文章主要分析一下我们的作业的代码。 作业主要就是在一个框架下实现相关算法。 论文中提供了一张简要的raft算法总结图(论文fi...

2019-11-07 17:24:15 184 0

原创 分布式系统——Raft的分析

这是一篇来自研究生一年级的课程—— 《分布式系统》 的作业记录博客。 其主要是实现分布式系统中一致性的算法 Raft 。 论文链接如下:Raft算法英文原文地址 而中文翻译地址如下:中文翻译版本 首先我们大致通过一个动画过程来了解一下Raft。链接如下:Raft动画演示 1 分布式系统的一致性问...

2019-11-06 21:52:44 84 0

原创 Ubuntu中Go环境配置与运行

安装Go 首先安装Go对应版本压缩包 然后输入指令: tar -C /usr/local -xzf go$VERSION.$OS-$ARCH.tar.gz 然后在 /usr/local/ 就有了 go文件夹 接着我们进行环境变量的设置: 输入指令 sudo gedit /etc/profile...

2019-11-04 21:09:16 204 0

原创 Pytorch Mobile 之Android Demo源码分析

现如今,在边缘设备上运行机器学习/深度学习变得越来越流行,它需要更低的时延。 而从Pytorch 1.3开始,我们就可以使用Pytorch将模型部署到Android或者ios设备中。 Pytorch官方文档中提供两个关于Pytorch-mobile的Demo: Github地址 主要包含了两个A...

2019-10-30 21:59:03 2821 29

转载 Android NDK相关知识总结(转自Android Developer中文档)

1 NDK 使用入门 原生开发套件 (NDK) 是一套工具,使您能够在 Android 应用中使用 C 和 C++ 代码,并提供众多平台库,您可使用这些平台库管理原生 Activity 和访问物理设备组件,例如传感器和轻触输入。 对于Android初学者NDK不适合,但是若有以下事项,NDK可以派...

2019-10-30 17:14:44 70 0

原创 Pytorch【60天修炼计划】之第二阶段——进阶:卷积神经网络之LeNet

LeNet是来自论文《Gradient-Based Learning Applied to Document Recognition》中提出的网络,它是CNN的开山鼻祖,对于手写数字的识别有了当时最先进的结果。 这是LeNet的网络结构: input [ 1, 32 × 32 ] ( chan...

2019-10-24 16:37:24 76 0

原创 初始卷积神经网络CNN

学习深度学习一定要学习CNN,而CNN的发展非常快,从 LeNet 到 AlexNet 到 VGG 到 GoogleNet 再到 ResNet 再到 DenseNet,学习这些经典的网络首先需要了解卷积神经网络的相关知识。 下图就是LeNet的网络结构,如果你不懂CNN,是完全不明白这到底是个什么...

2019-10-24 15:09:58 61 0

原创 Pytorch【60天修炼计划】之第一阶段——入门:Kaggle实战-房价预测

Kaggle kaggle是一个著名的供机器学习爱好者交流的平台。网页为https://www.kaggle.com 。 今天为入门阶段的最后一天,我们对kaggle中的房价预测进行实操练习。 项目结构图如下: 按照之前转载知乎大佬的pytorch项目结构进行布置,最终结果如下: data / ...

2019-10-16 21:36:07 341 0

原创 Pytorch【60天修炼计划】之第一阶段——入门:softmax回归的实现

DAY 5 3.6 SOFTMAX回归的从零开始实现 import torch import torchvision import numpy as np 3.6.1 获取和读取数据 使用Fashion-MNIST数据集,设置batch大小为256 import torchvision.tra...

2019-10-10 16:19:16 65 0

转载 Pytorch【60天修炼计划】之第一阶段——入门2

之前写Pytorch的 代码时候,只用了一个main函数就搞定了,其实这样可读性是非常差的,所以我从知乎上找到了一篇知乎文章将如何合理组织代码的文章,现在把它转化成自己的东西。 项目文件组织架构 程序文件的组织架构为: 程序文件的组织结构: ├── checkpoints/ ├── data/ ...

2019-10-09 10:12:00 105 0

原创 Pytorch【60天修炼计划】之第一阶段——入门

前言: 【之前学习深度学习过程中用到了简单的Pytorch框架,但是几乎是断断续续的学习,所以非常不熟悉它的使用,所以准备开启一个60天修炼Pytorch的计划,我相信只要天天练,天天写,天天看,之后一定会熟悉它甚至能够使用它产生大的突破。】 这篇文章是这次计划中的第一阶段——入门,使用的是官方的...

2019-09-26 15:30:17 128 2

原创 Machine Learning In Action 学习笔记之 决策树

决策树是一种常见的机器学习算法,也是很容易理解的。顾名思义,它是基于树结构进行决策的。 如下图所示: 正方形表示 判断模块 , 椭圆形表示 终止模块,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点,叶节点表示决策结果。 1. 决策树的构造 构造决策树,需要解决的第一个问题就是,当前数据...

2019-09-25 16:18:19 43 0

原创 Machine Learning In Action 学习笔记之 KNN算法

kNN算法应该是整个机器学习算法里最最容易理解的算法。 k-近邻算法 它采用测量不同特征值之间的距离来进行分类,求距离是整个算法中最核心的部分。 K-近邻,顾名思义,取离测试样例最近的k个已知类型样例,其中这个测试样例的类别即为这k个样例中占最多类别的样例类别。 下图为KNN的原理: 图中,如果...

2019-09-21 15:15:23 33 0

原创 Pytorch实现Logistic Regression

接上一个博客《Machine Learning In Action 学习笔记之 Logistic regression》,这使用的是Numpy进行回归,但我想改用Pytorch框架来写这个程序。 给定数据集(前两列为特征x1, x2,第三列为标签y) 如下所示: -0.017612 14.053...

2019-09-19 19:49:35 68 2

原创 Machine Learning In Action 学习笔记之 Logistic regression

一、 Logisitic regression 逻辑回归是机器学习算法中最基础的算法之一,简单的理解逻辑回归就是进行二分类。 其本质就是在空间中找到一个决策边界来完成分类的决策。 举个例子: 上图有一些数据,特征为x1 和 x2,类别为0 或 1,现在我们需要找到一个线来划分这个图,使得这条线上...

2019-09-17 10:45:12 56 0

原创 FRP实现内网穿透(建立个人服务器)

一、背景: 首先设想两个情景: 晚上回到宿舍后打开我的笔记本电脑远程连接我在实验室的台式机(性能高)跑程序。 我想在我本地电脑上搭建一个博客(localhost),不用上传到云服务器(阿里云或腾讯云)就能输入网址进行查看。 如果这两个设备同处一个内网,那么远程连接是没有任何难度的,但若第一个情...

2019-08-14 16:05:07 163 4

原创 通过腾讯云(阿里云)Cloud Server搭建远程Jupyter notebook

因为最近学习Python相关知识一直使用的是Jupyter notebook,但是我只是在自己的电脑上安装了Jupyter notebook,所以只是在本地服务器上使用,这样一旦没有了电脑就无法使用。 所以今天突发奇想,是否可以在自己买的服务器上搭建一个远程的Jupyter notebook,这样...

2019-07-26 15:18:18 443 1

原创 Python数据分析之pandas入门

pandas是python中使得数据分析工作变得更快更简单的高级数据结构和操作工具。 pandas有两个主要的数据结构,首先介绍其一Series。 Series from pandas import Series, DataFrame import pandas as pd obj = Se...

2019-07-18 20:08:09 67 0

原创 周志华《机器学习》(西瓜书)学习笔记——第五章神经网络

2019-07-16 20:32:12 213 0

原创 周志华《机器学习》(西瓜书)学习笔记——第四章决策树

2019-07-16 20:28:44 121 0

提示
确定要删除当前文章?
取消 删除