自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(76)
  • 收藏
  • 关注

原创 北京小区分布1

小区链接 小区名称 区划 商圈 环数 经纬度 周围学校(三公里以内) 距小区最近的好小学(位于榜单上) 距离小区最近的5所小学里是否有榜单上的好小学 平均单价 建成年代 建筑类型 房屋总数 楼栋总数 绿化率 容积率 交易权属 供暖类型 用水类型 用电类型 https://bj.lianjia.com/xiaoqu/1111063658204/ 京贸国际公馆 通州 九棵树(家

2024-07-16 16:06:58 677

转载 一台电脑绑定两个git帐号(GitHub和GitLab)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

2019-09-13 16:52:54 651

原创 leetcod之编辑距离

编辑距离(leetcode72)这是一道经典的动态规划问题。我们将$ dp[i][j] 定义为定义为定义为 word1[0…i-1] 到到到 word2[0…j-1] 的编辑距离。状态转移方程有两种情况:边界情况和一般情况。在以上的说明中,的编辑距离。状态转移方程有两种情况:边界情况和一般情况。在以上的说明中,的编辑距离。状态转移方程有两种情况:边界情况和一般情况。在以上的说明中,i和和和j$...

2019-09-11 22:49:33 203

转载 自然语言处理之维特比算法

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 ...

2019-08-20 23:08:57 483

转载 消息队列系列1-概要

转载自http://rjzheng.cnblogs.com/消息队列为什么写这篇文章?博主有两位朋友分别是小A和小B:小A,工作于传统软件行业(某社保局的软件外包公司),每天工作内容就是和产品聊聊需求,改改业务逻辑。再不然就是和运营聊聊天,写几个SQL,生成下报表。又或者接到客服的通知,某某功能故障了,改改数据,然后下班部署上线。每天过的都是这种生活,技术零成长。小B,工作于某国企,虽然能接触到...

2019-08-20 00:08:27 190

原创 数组中前k大的数系列

1. 概述给定一个数组array,大小为n,找到其中第k大的数或者前k大的数。这是一个电面高频题,有快排,堆排等多种思路来解题,本文章将从时间复杂度和空间复杂度,来介绍这些算法以及它们所适用的场景2. 堆排直观上理解找到第k大或者前k大的数,用的是最大堆,但实际上最小堆也是可以的,至于具体使用哪一种,则取决于问题的场景。一般来说,面试答的是最小堆(省空间)2.1 最大堆要找第k大的元素,...

2019-08-18 20:42:29 2281

原创 leetcode之二叉树

236. 二叉树的最近公共祖先主要思想:定义lowestCommonAncestor(root,p,q)函数,如果p,q都在root这棵树里,则返回它们的最近公共祖先;如果p和q只有一个在root这颗树中,则返回在root这棵树中的p或q;如果p和q都不在root这棵树中,则返回Noneclass Solution(object): def lowestCommonAncestor...

2019-08-12 18:00:47 133

原创 机器学习中的集成学习

一.Voting从最简单的Voting说起,这也可以说是一种模型融合。假设对于一个二分类问题,有3个基础模型,那么就采取投票制的方法,投票多者确定为最终的分类。二.Averaging对于回归问题,一个简单直接的思路是取平均。稍稍改进的方法是进行加权平均。权值可以用排序的方法确定,举个例子,比如A、B、C三种基本模型,模型效果进行排名,假设排名分别是1,2,3,那么给这三个模型赋予的权值分别是...

2019-08-08 12:23:17 382

原创 数学之美:布隆过滤器

算法题目如果一个黑名单网站包含100亿个黑名单网页,每个网页最多占64B,设计一个系统,判断当前的URL是否在这个黑名单当中,要求额外空间不超过30GB,允许误差率为万分之一。解题思路布隆过滤器基础介绍布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量(位图)和一系列随机映射函数(哈希函数)。布隆过滤器可以用于检索一个元素是否在一个集合中...

2019-08-05 10:47:08 294

原创 KMP算法的理解与应用

1.KMP算法的原理KMP算法是一个经典的不能再经典的字符串匹配算法,因此有必要好好的从理解到应用来熟悉这个算法1.1 KMP算法的问题定义问题定义:给定一个目标串S和一个模式串T(S长度大于等于T),判定模式串T是否是S的一个子串,如果是,则返回T在S中出现的第一个字符对应的下标,否则返回-11.2 KMP算法的数据结构KMP算法的核心在于它的数据结构,即next数组,而next数组是...

2019-08-04 23:30:53 353

原创 排序

class Heap: # def heapify(self, nums): # # O(nlogn)时间复杂度 # for i in range(len(nums)): # self.sift_up(nums, i) def heapify(self, nums): # O(n)时间复杂度 ...

2019-07-28 14:27:45 139

原创 神经网络中的各种归一化算法

摘要  神经网络中有各种归一化算法:Batch Normalization (BN)、Layer Normalization (LN)、Instance Normalization (IN)、Group Normalization (GN)。从公式看它们都差不多:无非是减去均值,除以标准差,再施以线性映射。y=γ(x−μ(x)σ(x))y=γ(\frac{x-μ(x)}{σ...

2019-07-13 16:45:43 3256

原创 beam search及pytorch实现

主要记录两种不同的beam search版本版本一,使用类似层次遍历的方式进行搜索,用队列进行维护,每次循环对当前层的所有节点进行搜索,这些节点每个分别对应topk个节点作为下一层候选节点,取所有候选节点的前tok个作为下一层节点加入队列bfs with width constraint. 启发式搜索的一种. 属于贪心算法. 如果k -> inf,那么等价于bfs.从根节点开始(),...

2019-07-13 00:12:01 10372 3

转载 数据库与数据仓库的异同(以HIVE和MySQL为例)

原文:https://blog.csdn.net/qq_39521554/article/details/79883816数据库(database):传统的关系型数据库的主要应用(OLTP),主要是基本的、日常的事务处理,例如银行交易。数据仓库(data warehouse):数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操...

2019-06-30 15:51:58 2033

原创 pyltp的使用

pyltp 是 LTP 的 Python 封装,提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能。使用前请先下载完整模型请先下载完整的 LTP 模型文件下载地址 - 百度云当前模型版本 - 3.4.0请确保下载的模型版本与当前版本的 pyltp 对应,否则会导致程序无法正确加载模型。请注意编码pyltp 的所有输入的分析文本和输出的结果的编码均为 UTF-8。如...

2019-06-14 00:33:11 1523

转载 mysql8 :客户端连接caching-sha2-password问题

问题:caching-sha2-password遇到这个问题了。是由于在mysql8之前的版本使用的密码加密规则是mysql_native_password,但是在mysql8则是caching_sha2_password。处理:ALTER USER 'root'@'localhost' IDENTIFIED BY 'password' PASSWORD EXPIRE NEVER; #修改加...

2019-06-11 13:07:06 398

原创 面试知识点

如何方式过拟合正则dropoutBNearly stop交叉验证换激活函数换损失函数换网络结构(如skip-connection)

2019-06-03 10:54:55 128

原创 numpy知识点总结

numpy数组不要使用系统的random.shuffle,否则数据会被破坏;要使用np.random.shuffle()

2019-05-13 14:29:09 220

原创 Django model中的 class Meta

Model 元数据就是 “不是一个字段的任何数据” – 比如排序选项, admin 选项等等。通过一个内嵌类 “class Meta” 给你的 model 定义元数据, 类似下面这样:class Foo(models.Model): bar = models.CharField(maxlength=30) class Meta: # ...下面是所有可能...

2019-04-30 10:59:46 343

原创 seq2seq以及attention模型的pytorch实现(以机器翻译为例)

前言本系列教程为pytorch官网文档翻译。本文对应官网地址:https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html系列教程总目录传送门:我是一个传送门本系列教程\对应的 jupyter notebook 可以在我的Github仓库下载:下载地址:https://github.com/Hol...

2019-04-20 00:25:53 4605 2

原创 leetcode130. 被围绕的区域

题目描述给定一个由 ‘1’(陆地)和 ‘0’(水)组成的的二维网格,计算岛屿的数量。一个岛被水包围,并且它是通过水平方向或垂直方向上相邻的陆地连接而成的。你可以假设网格的四个边均被水包围。示例:X X X XX O O XX X O XX O X X运行你的函数后,矩阵变为:X X X XX X X XX X X XX O X X解释:被围绕的区间不会存在于边界上,换...

2019-04-11 17:05:08 121

原创 pytorch中的一些细节

RNN中隐状态hhh的维度默认为(seq_len, batch_size, input_size),此时batch_first=False,另外在NLP任务中,input_size为embedding_dim当设置batch_first为True时,维度为(batch_size, seq_len,input_size)...

2019-04-03 17:16:35 600 1

原创 二叉树问题:leetcode(572) 另一个树的子树

题目描述给定两个非空二叉树 s 和 t,检验 s 中是否包含和 t 具有相同结构和节点值的子树。s 的一个子树包括 s 的一个节点和这个节点的所有子孙。s 也可以看做它自身的一棵子树。示例 1:给定的树 s: 5 / \ 4 5 / \ 1 2给定的树 t: 4 / \ 1 2返回true,因为 t 与 s 的一个子树拥有相同的...

2019-03-29 11:01:28 317

原创 文本分类系列(2):TextRNN及其pytorch实现

[文本分类系列(1):TextCNN及其pytorch实现](https://blog.csdn.net/u014514939/article/details/88834548)TextRNN尽管TextCNN能够在很多任务里面能有不错的表现,但CNN有个最大问题是固定 filter_size 的视野,一方面无法建模更长的序列信息,另一方面 filter_size 的超参调节也很繁琐。CNN...

2019-03-27 18:18:32 6325 8

原创 文本分类系列(1):textcnn及其pytorch实现

textcnn原理:核心点在于使用卷积来捕捉局部相关性,具体到文本分类任务中可以利用CNN来提取句子中类似 n-gram 的关键信息。textcnn详细过程:第一层是图中最左边的7乘5的句子矩阵,每行是词向量,维度=5,这个可以类比为图像中的原始像素点了。然后经过不同 filter_size的一维卷积层(这里是2,3,4),每个filter_size 有filter_num(这里是2)个输...

2019-03-27 02:15:45 11829 7

转载 torchtext入门教程,轻松玩转文本数据处理

用深度学习做nlp也有一段时间了,熟悉这块内容的同学都知道,实践算法的时候,写模型是个简单的事,最麻烦的是数据处理,数据处理不仅会浪费我们大部分时间,而且会消耗很大的计算资源,浪费人力物力。今年开始接触pytorch,简洁的API,动态图,更加灵活的编写模式,诸多优点不用多说。最近尝试使用torchtext工具,这里想先说明的是,torchtext并不是pytorch所独有的,使用其它深度学习框架...

2019-03-27 00:38:24 3701

原创 pytorch学习笔记系列(6):循环神经网络和双向循环神经网络---MNIST数据集

Pytorch中LSTM的定义如下:class torch.nn.LSTM(*args, **kwargs)参数列表input_size:x的特征维度hidden_size:隐藏层的特征维度num_layers:lstm隐层的层数,默认为1bias:False则bih=0b_{ih}=0bih​=0和bhh=0b_{hh}=0bhh​=0. 默认为Truebatch_first:...

2019-03-25 15:13:11 1022 1

原创 pytorch学习笔记系列(5):卷积神经网络Conv2d&&Conv1d

关于 nn.torch.Conv2d 函数CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)假设 Conv2d 的输入 input 尺寸为 (N,Cin,Hin,Win)(N,C_{in},H_{in},W_...

2019-03-25 00:12:51 2770 2

原创 pytorch学习笔记系列(4):前向神经网络

import torchimport torch.nn as nnimport torchvisionimport torchvision.transforms as transforms# Device configurationdevice = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# Hyp...

2019-03-24 23:33:36 429

原创 pytorch学习笔记系列(3):Logistic Regression实现MNIST数据集分类

import torchimport torch.nn as nnimport torchvisionimport torchvision.transforms as transforms# 超参数input_size = 784num_classes = 10num_epochs = 5batch_size = 100learning_rate = 0.001# MNIS...

2019-03-24 23:25:23 810

原创 pytorch学习笔记系列(1):基础运算

import torch import torchvisionimport torch.nn as nnimport numpy as npimport torchvision.transforms as transforms# ================================================================== ## ...

2019-03-24 23:03:48 239

原创 pytorch学习笔记系列(2):实现Linear Regression

pytorch实现Linear Regression做预测时numpy()函数不能计算带有requires grad属性的参数,因此需要使用detachimport torchimport torch.nn as nnimport numpy as npimport matplotlib.pyplot as plt# Hyper-parametersinput_size = 1...

2019-03-24 23:01:56 194

转载 XGBOOST与GBDT的比较

xgboost相比传统gbdt有何不同?xgboost为什么快?xgboost如何支持并行?传统GBDT以CART作为基分类器,xgboost还支持线性分类器,这个时候xgboost相当于带L1和L2正则化项的逻辑斯蒂回归(分类问题)或者线性回归(回归问题)传统GBDT在优化时只用到一阶导数信息,xgboost则对代价函数进行了二阶泰勒展开,同时用到了一阶和二阶导数。顺便提一下,xgboos...

2019-03-19 14:56:19 238

转载 如何使用pyuthon读取大文件

本文章转载自http://www.cnblogs.com/wenBlog/p/8441231.html准备工作我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 ...

2019-03-11 23:25:39 145

原创 Python知识

转载自:https://www.cnblogs.com/waltsmith/p/8029539.html Python中的zip()与*zip()函数详解 <div class="postBody"> <div id="cnblogs_post_body" c...

2018-06-07 10:16:36 797

原创 剑指offer_复杂链表的复制

题目描述输入一个复杂链表(每个节点中有节点值,以及两个指针,一个指向下一个节点,另一个特殊指针指向任意一个节点),返回结果为复制后复杂链表的head。(注意,输出结果中请不要返回参数中的节点引用,否则判题程序会直接返回空)思路在原链表每个结点后面插入一个新结点,新结点值为原结点的值。依次将原链表每个结p点的随机指针指向的结点的下个结点p->random赋值给q=p->next结点的随机...

2018-04-04 15:52:07 135

原创 剑指offer_二叉树中和为某一值的路径

题目描述输入一颗二叉树和一个整数,打印出二叉树中结点值的和为输入整数的所有路径。路径定义为从树的根结点开始往下一直到叶结点所经过的结点形成一条路径。思路:    采用回溯,该段代码还是好好揣摩揣摩。    /*struct TreeNode { int val; struct TreeNode *left; struct TreeNode *right; TreeNode(int x) ...

2018-04-04 13:34:12 112

原创 剑指offer_二叉搜索树的后序遍历序列

原题描述    输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果。如果是则输出Yes,否则输出No。假设输入的数组的任意两个数字都互不相同。思路       采用递归的思想。首先明确二叉搜索树的概念(左小右大),不要与二叉线索树混淆了。以数组的最后一个数为根节点,根据左小右大的原则找到右子树的第一个结点,然后判定右子树中是否有小于根节点的值,有则返回false;最后注意递归结束的条件...

2018-04-03 10:30:30 132

原创 剑指offer_从上往下打印二叉树

原题描述        从上往下打印出二叉树的每个节点,同层节点从左至右打印。思路        就是个二叉树的层次遍历,采用队列即可。需要注意root若为空直接返回空的vector/*struct TreeNode { int val; struct TreeNode *left; struct TreeNode *right; TreeNode(int x) : val(x),...

2018-04-03 09:11:43 144

原创 剑指offer_顺时针打印矩阵

题目描述:输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字,例如,如果输入如下矩阵: 1 2 3 4 5 6 7 8 9 10 11 1213 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10.思路:             类比魔方逆时针旋转的思想。先把第一行的元素全部打印出来,然后删除第一行,逆时针旋转整个矩阵。    ...

2018-04-02 10:47:26 132

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除