自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 字节跳动 NLP算法实习面试问题清单

自我介绍讲讲比较擅长的项目讲讲LSTMTFIDF, LDA, 是否有动手复现XGB LGB及其优势和原因文本聚类,KMeans,如何选取初始中心点,如何确定K值。算法题:1 两个有序序列的中位数,算法复杂度 O(log(m+n)) 没有完成2 打印螺旋矩阵3 严格递增数组A [1,3,4,5,6,8],循环后B [5,6,8,1,3,4],给定x ,输出在B中下...

2018-09-20 23:53:05 7762 2

原创 百度实习面试经验(待续)

百度实习的面试是师兄内推的,直接是一轮电话面试加一轮现场技术面试,所以没有笔试经验。简历是自然语言处理算法相关(本渣真正有深入接触的只有短文本语义相似度计算,其他最多略知皮毛),师兄内推的是一个多模态语义计算小组,涉及到图片问答、借助知识图谱的语义推理等。电话面试:整体来说电话面试没做好准备,仓促慌乱(直接从本科毕业的暑假浪完一圈回来,临时决定找的实习)。1 首先问的一个问题是关于之前...

2018-09-15 00:20:05 642

原创 【LeetCode 385】Mini Parser(Python)

Problem:Given a nested list of integers represented as a string, implement a parser to deserialize it.Each element is either an integer, or a list -- whose elements may also be integers or other l...

2018-09-13 09:24:20 331

原创 【LeetCode 4】Median of Two Sorted Arrays(Python)

Problem:There are two sorted arrays nums1 and nums2 of size m and n respectively.Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).You may assume n...

2018-09-12 12:58:53 305

原创 spark基础知识汇总

什么是spark?首先翻译spark官方文档的介绍:Apache Spark是一个快速的、广泛适用的集群计算系统,它提供高层次的Java、Scala、Python和R的API,以及支持常规执行图的优化引擎。它同样还支持许多高层次的工具,如Spark SQL,可以用来实现SQL和结构化数据处理;MLlib,用来实现机器学习算法;GraphX,用于图处理;Spark Streaming等。...

2018-08-23 11:59:54 285

原创 Tensorflow要点与优化技巧

Graph 构建与Session过程:1 尽量使用变量,而不要使用常量:    在tensorflow中,常量是作为op存在图中,会没必要的占用很多内存,如果使用变量,只会在session中根据实际需求,动态分配内存2 将所有节点和op提前定义在静态图中,而不要在session中重新添加新的op(lazy loading)   tensorflow有对于静态图计算的优化,每个op只...

2018-08-02 11:03:06 440

原创 学习整理

深度学习书籍1 Deep Learning: http://www.deeplearningbook.org

2018-06-11 10:07:32 140

原创 Spark 性能调优与使用经验

spark使用常识性能调优1 shuffle  a 宽窄依赖的说明  b shuffle原理以及如何优化shuffle   c 如何避免数据倾斜2 join    a 字符串与数组转化  大数据下的思维方式与内存管理...

2018-04-26 13:12:52 165

原创 【LeetCode 135】Candy (Python)

Problem:There are N children standing in a line. Each child is assigned a rating value.You are giving candies to these children subjected to the following requirements:Each child must have at least on...

2018-03-17 15:22:55 470

原创 【LeetCode 11】Container With Most Water (Python)

Question:Given n non-negative integers a1, a2, ..., an, where each represents a point at coordinate (i, ai). n vertical lines are drawn such that the two endpoints of line i is at (i, ai) and (i, 0). ...

2018-03-17 12:05:14 215

原创 【LeetCode 15】3Sum (C++)

Problem:Given an array S of n integers, are there elements a, b, c in S such that a + b + c = 0? Find all unique triplets in the array which gives the sum of zero.Note: The solution set must not conta...

2018-03-15 17:13:09 358

原创 【LeetCode 96】Unique Binary Search Trees (C++)

Problem:Given n, how many structurally unique BST's (binary search trees) that store values 1...n?For example,Given n = 3, there are a total of 5 unique BST's. 1 3 3 2 1 \ ...

2018-03-14 10:39:50 196

原创 【LeetCode 110】Balanced Binary Tree (C++)

Problem:Given a binary tree, determine if it is height-balanced.For this problem, a height-balanced binary tree is defined as:a binary tree in which the depth of the two subtrees of every node never d...

2018-03-13 21:16:10 340

原创 【LeetCode 114】Flatten Binary Tree to Linked List (C++)

Problem:Given a binary tree, flatten it to a linked list in-place.For example,Given 1 / \ 2 5 / \ \ 3 4 6The flattened tree should look like: 1 \ ...

2018-03-12 22:52:38 221

原创 【LeetCode 98】Validate Binary Search (C++)

Problem:Given a binary tree, determine if it is a valid binary search tree (BST).Assume a BST is defined as follows:The left subtree of a node contains only nodes with keys less than the node's key.Th...

2018-03-11 17:09:43 240

原创 【LeetCode 102】Binary Tree Level Order Traversal (C++)

Problem:Given a binary tree, return the level order traversal of its nodes' values. (ie, from left to right, level by level).For example:Given binary tree [3,9,20,null,null,15,7], 3 / \ 9 20...

2018-03-11 11:48:08 211

原创 【LeetCode 606】 Construct String from Binary Tree (C++)

Problem:You need to construct a string consists of parenthesis and integers from a binary tree with the preorder traversing way.The null node needs to be represented by empty parenthesis pair "()". An...

2018-03-11 10:23:50 144

原创 对MySQL中JSON数据类型的操作和分析

JSON作为以键值对为主的存储形式,符合很多业务场景,尤其对于python中dict字典数据类型,能直接相互转换,更加适应了python的某些使用情况。 此外,JSON作为不限定固定结构的键值对,能方便灵活的使用在数据变动性比较大的场景,如对于网络数据的爬取收集等,当然其中也存在一些问题,下文再分析。这里本文先列举MySQL中对一些JSON数据类型的常用语句和函数(参考MySQL官方文档,建议大家

2017-08-15 21:34:32 25547 2

原创 Scrapy元素选择器Xpath用法汇总

众所周知,在设计爬虫时,最麻烦的一步就是对网页元素进行分析,目前流行的网页元素获取的工具有BeautifulSoup,lxml等,而据我使用的体验而言,Scrapy的元素选择器Xpath(结合正则表达式)是其中较为出色的一种(个人认为最好啦,当然只能在Scrapy中使用)功能相对较全、使用较为方便,正因为它的丰富性,有时很多功能会忘记,所以在这里整理好记录下来,方便今后查阅使用。1. 元素的多级定位

2017-08-12 10:12:19 34834 6

原创 Python中的UnboundLocalError: variable referenced before assignment错误分析与解决

无论python2还是python3中都会出现UnboundLocalError,这个错误由“variable xxx referenced before assignment”得知是由于变量还没有赋值初始化就被引用造成的,如本人在scrapy 中遇到的问题:yield scrapy.Request(next_url,callback=self.parse)执行就会报“local variable

2017-08-10 10:42:09 5796

原创 以MongoDB为例与关系型数据库比较

声明:本文属于探讨性话题,肯定存在很多疏漏和错误,不要盲目相信,大家发现什么错误或者有什么想法请求务必告知 在比较之前,先介绍一个重要的概念:数据库事务 作为单个逻辑工作单元执行的一系列操作,要么完全地执行,要么完全地不执行。 一个逻辑工作单元要成为事务,必须满足所谓的ACID(原子性、一致性、隔离性和持久性)属性。事务是数据库运行中的逻辑工作单位,由DBMS中的事务管理子

2017-08-09 10:57:31 2791

原创 MongoDB 常用命令与经验

MongoDB 常用命令1 查看数据库系统信息 + show dbs + show collections + db.stats() :查看当前使用的数据库的信息 + db.myCollection.stats():查看当前数据库中myCollection集合的信息

2017-08-08 10:22:50 251

原创 Ubuntu终端与Vim常用命令

系统命令**1 查看系统版本:**cat /etc/issue **2 查看软件版本及其他信息:**aptitude show xxx **3 查看软件安装位置:**dpkg -L xxx,注意这里的软件名必须是软件全名,可以先用4查看是否安装有包含软件部分名的软件,然后再查看位置。 **4 查看软件是否安装:**dpkg -l | grep xxxVim 命令

2017-08-07 13:55:56 859

原创 MySql 限制连接进程数

mysql 服务器对于连接的每个进程,如果客户端没有主动关闭该进程,那么服务器在杀死该进程前默认等待的时间是8小时,对于访问较为频繁的数据库,很有可能在短时间内由于访问量过大,同时闲置进程(sleep状态)又没有被及时清除,造成进程堵塞,也就是大家经常碰见的“too many connections”错误对此问题,我们可以重新设置服务器等待的时间,将其减小,这需要修改my.cnf文件。默认在/etc

2017-06-27 20:16:34 2453

原创 小技巧小知识——Python

字符串1 strip(str)函数:循环去除字符串首尾中包含于str的字符,默认去除空格I/O1 格式化输出:”%4d and %s and %.2f”%(32,”其实和C语言差不多”,3.2)

2017-06-27 20:04:05 221

原创 C++小知识更新

数据对象1,结构体的使用不同于C语言,如struct edge{ int pow; int v; edge *next;};其中edge可以直接用来声明结构体类型的对象,此外struct edge{ int pow; int v; edge *next;}edge1,edge2,edges[10];可以直接在结构体定义时声明对象头文件函数1,cst

2017-04-02 19:53:29 751

原创 C语言中字符串与各数值类型之间的转换

c语言的算法设计中,经常会需要用到字符串,而由于c语言中字符串并不是一个默认类型,其标准库stdlib设计了很多函数方便我们处理字符串与其他数值类型之间的转换。首先放上一段展示各函数使用的代码,大家也可以copy到自己的机器上运行观察#include <stdio.h>#include <stdlib.h>int main(int argc, char *argv[]) { int num

2017-03-31 16:45:50 20172

原创 Django之URL调度与参数传递

这篇博客的所有知识都是从Django的URLconf所得,这篇博客只是一个重点列举。URL配置URL配置本质是一个网站的导航流(navigate flow),将网站各页面的url和对应的控制器连接起来,从而通过控制器实现model和view的调度,将整个网站的各个模块联结起来。首先从一段代码开始:from django.conf.urls import url from . impo

2017-03-27 11:44:15 1574

原创 Django之MVC解析

正文之前,先引入大牛刘未鹏博客mind hacks的一篇博客《编程的首要原则是什么》中的一句话: 学习一项知识,必须问自己三个重要问题:1,它的本质是什么;2,它的第一原则是什么;3,它的知识结构是怎样的。这里结合我自己的情况,稍加改变这句话为: 学习一项知识,必须问自己三个重要问题:1,它的本质是什么;2,它的知识结构是怎样的;3,它的特性是什么。MVC框架模式解析1,MVC的本质是什

2017-03-27 00:16:49 2388 1

原创 你到底要实现什么之简易搜索引擎

过去一个月的时间,和小伍一起完成了一个简易的搜索引擎,这算是我真正意义上的第一部与别人合作完成的作品,其过程曲折坎坷,入坑无数,而这些思维上的坑,不觉时仿佛前方是一片康庄大道,等到真正往前一步步走的时候,才真正发觉那些被思维的局限性和盲点所遮掩的坑。所以,我写下这篇博客,希望从这些踩过的坑中,寻找出某些规律或者发现思维的某些惯有的缺陷,从而在之后的路上,能尽可能的避开这些坑,提高自己的学习与成长效率

2017-03-25 23:22:02 2592

原创 C语言小知识更新

内存1 用递归实现算法时,虽然程序简洁,但一旦递归深度过大,对堆栈内存空间的消耗变大,可考虑用数组或其他数据结构”缓存“2 在大部分编译器下,long 和int的大小一样,都为4字节,long long 为8字节3 两个变量相乘,乘积的最大值取决于这两个变量的最大内存,而不取决于结果变量。I/O1 %*d在输出时星号表示输出长度占位符,如: printf(“%*d”,4,a); 而在输入

2016-11-19 23:39:50 412

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除