自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 2018春招实习-机器学习算法工程师各个公司面试经验

2018年1月初结束了上一个公司的实习,在三月初开始找今年的暑期实习,因为前面一个公司一直在做数据挖掘工程师的工程,加上自己想去互联网锻炼一下,同时想寻求算法工程师的工作,所以投了大概6家公司的机器学习算法岗,包括阿里妈妈,美团点评搜索组,腾讯SNG,滴滴,初创公司栈略数据,百度。目前是收获了三家公司的offer,腾讯,百度和栈略数据。阿里妈妈:那时候阿里妈妈的暑期内推特别早,年前就开...

2018-07-13 15:49:08 1921 1

原创 和为S的连续正数序列

题目描述:小明很喜欢数学,有一天他在做数学作业时,要求计算出9~16的和,他马上就写出了正确答案是100。但是他并不满足于此,他在想究竟有多少种连续的正数序列的和为100(至少包括两个数)。没多久,他就得到另一组连续正数和为100的序列:18,19,20,21,22。现在把问题交给你,你能不能也很快的找出所有和为S的连续正数序列? Good Luck!输出描述:输出所有和为S的连续正数

2018-01-28 23:54:24 338

原创 2018网易校招-字符串碎片

题目描述:一个由小写字母组成的字符串可以看成一些同一字母的最大碎片组成的。例如,”aaabbaaac”是由下面碎片组成的:’aaa’,’bb’,’c’。牛牛现在给定一个字符串,请你帮助计算这个字符串的所有碎片的平均长度是多少。输入描述:输入包括一个字符串s,字符串s的长度length(1 ≤ length ≤ 50),s只含小写字母('a'-'z')输出描述:输出一个整数,表示所有碎片的平均长度,四

2017-10-18 15:50:40 398

原创 2018网易校招- 魔法币

小易准备去魔法王国采购魔法神器,购买魔法神器需要使用魔法币,但是小易现在一枚魔法币都没有, 但是小易有两台魔法机器可以通过投入x(x可以为0)个魔法币产生更多的魔法币。 魔法机器1:如果投入x个魔法币,魔法机器会将其变为2x+1个魔法币 魔法机器2:如果投入x个魔法币,魔法机器会将其变为2x+2个魔法币 小易采购魔法神器总共需要n个魔法币,所以小易只能通过两台魔法机器产生恰好n个魔法币,

2017-10-16 16:23:32 1145

原创 2018美团点评校招-K的倍数

题目描述:序列中任意个连续的元素组成的子序列被称为该序列的字串 现在给你一个序列P和一个整数K,询问元素和是K的倍数的子串的最大长度 比如序列{1,2,3,4,5},给定的整数K为5,其中满足条件的子串为{5}、{2,3}、{1,2,3,4} 、{1,2,3,4,5},那么答案就为5,因为最长的子串为{1,2,3,4,5}; 如果满足条件的子串不存在,就输出0输入:第一个含一个整数N,1<=

2017-09-01 16:28:52 1298

原创 2018网易校招内推-小易喜欢的数列

题目描述:小易非常喜欢拥有以下性质的数列: 1、数列的长度为n 2、数列中的每个数都在1到k之间(包括1和k) 3、对于位置相邻的两个数A和B(A在B前),都满足(A <= B)或(A mod B != 0)(满足其一即可)例如,当n = 4, k = 7 那么{1,7,7,2},它的长度是4,所有数字也在1到7范围内,并且满足第三条性质,所以小易是喜欢这个数列的 但是小易不喜欢{4,4,

2017-08-30 16:20:25 483

原创 2018网易校招内推-疯狂队列

题目描述:小易老师是非常严厉的,它会要求所有学生在进入教室前都排成一列,并且他要求学生按照身高不递减的顺序排列。有一次,n个学生在列队的时候,小易老师正好去卫生间了。学生们终于有机会反击了,于是学生们决定来一次疯狂的队列,他们定义一个队列的疯狂值为每对相邻排列学生身高差的绝对值总和。由于按照身高顺序排列的队列的疯狂值是最小的,他们当然决定按照疯狂值最大的顺序来进行列队。现在给出n个学生的身高,请计算

2017-08-30 14:58:12 529

原创 2018网易校招内推-堆棋子(Python)

题目描述:小易将n个棋子摆放在一张无限大的棋盘上。第i个棋子放在第x[i]行y[i]列。同一个格子允许放置多个棋子。每一次操作小易可以把一个棋子拿起并将其移动到原格子的上、下、左、右的任意一个格子中。小易想知道要让棋盘上出现有一个格子中至少有i(1 ≤ i ≤ n)个棋子所需要的最少操作次数.输入描述:输入包括三行,第一行一个整数n(1 ≤ n ≤ 50),表示棋子的个数第二行为n个棋子的横坐标x

2017-08-26 22:23:18 725

转载 Spark-机器学习模型持久化

在即将发布的Apache Spark 2.0中将会提供机器学习模型持久化能力。机器学习模型持久化(机器学习模型的保存和加载)使得以下三类机器学习场景变得容易:数据科学家开发ML模型并移交给工程师团队在生产环境中发布;数据工程师把一个Python语言开发的机器学习模型训练工作流集成到一个Java语言开发的机器学习服务工作流;数据科学家创建多个训练ML模型的作业,稍后需要保存和评估。Spark M

2017-08-26 12:25:29 8786 1

转载 当推荐系统遇上深度学习

原文:Deep Learning Meets Recommendation SystemsPublished by Wann-Jiun Ma at ** January 24, 2017https://blog.nycdatascience.com/student-works/deep-learning-meets-recommendation-systems/ Contributed by

2017-08-23 10:09:37 1532

原创 2018网易校招内推笔试-独立的小易(python)

题目描述:小易为了向他的父母表现他已经长大独立了,他决定搬出去自己居住一段时间。一个人生活增加了许多花费: 小易每天必须吃一个水果并且需要每天支付x元的房屋租金。当前小易手中已经有f个水果和d元钱,小易也能去商店购买一些水果,商店每个水果售卖p元。小易为了表现他独立生活的能力,希望能独立生活的时间越长越好,小易希望你来帮他计算一下他最多能独立生活多少天。 输入描述:输入包括一行,四个整数x, f,

2017-08-20 12:19:10 1105

原创 2018网易内推笔试-操作序列(python)

题目描述: 小易有一个长度为n的整数序列,a_1,…,a_n。然后考虑在一个空序列b上进行n次以下操作:1、将a_i放入b序列的末尾2、逆置b序列小易需要你计算输出操作n次之后的b序列。 输入描述:输入包括两行,第一行包括一个整数n(2 ≤ n ≤ 2*10^5),即序列的长度。第二行包括n个整数a_i(1 ≤ a_i ≤ 10^9),即序列a中的每个整数,以空格分割。输出描述:在一行中输出操

2017-08-19 20:11:23 1443

原创 2018网易内推笔试-交错01串(python)

题目描述:如果一个01串任意两个相邻位置的字符都是不一样的,我们就叫这个01串为交错01串。例如: “1”,”10101”,”0101010”都是交错01串。 小易现在有一个01串s,小易想找出一个最长的连续子串,并且这个子串是一个交错01串。小易需要你帮帮忙求出最长的这样的子串的长度是多少。 输入描述:输入包括字符串s,s的长度length(1 ≤ length ≤ 50),字符串中只包含'0'

2017-08-19 19:48:55 1291

原创 2018网易内推笔试-等差数列(python)

题目描述:如果一个数列S满足对于所有的合法的i,都有S[i + 1] = S[i] +d, 这里的d也可以是负数和零,我们就称数列S为等差数列。 小易现在有一个长度为n的数列x,小易想把x变为一个等差数列。小易允许在数列上做交换任意两个位置的数值的操作,并且交换操作允许交换多次。但是有些数列通过交换还是不能变成等差数列,小易需要判别一个数列是否能通过交换操作变成等差数列输入描述:输入包括两行,第一

2017-08-19 19:37:40 2456

原创 2018网易内推笔试-彩色的砖块(python)

题目描述:小易有一些彩色的砖块。每种颜色由一个大写字母表示。各个颜色砖块看起来都完全一样。现在有一个给定的字符串s,s中每个字符代表小易的某个砖块的颜色。小易想把他所有的砖块排成一行。如果最多存在一对不同颜色的相邻砖块,那么这行砖块就很漂亮的。请你帮助小易计算有多少种方式将他所有砖块排成漂亮的一行。(如果两种方式所对应的砖块颜色序列是相同的,那么认为这两种方式是一样的。)例如: s = "ABAB

2017-08-19 19:29:00 1824

原创 K-means和K-means++的算法原理及sklearn库中参数解释、选择

前言:  这篇博文主要介绍k-means聚类算法的基本原理以及它的改进算法k-means的原理及实现步骤,同时文章给出了sklearn机器学习库中对k-means函数的使用解释和参数选择。K-means介绍:  K-means算法是很典型的基于距离的聚类算法,采用距离 作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最

2017-08-08 16:48:32 57527 8

原创 机器学习自学之路-决策树 算法选择:三种算法优缺点比较(ID3、C4.5、CART)

ID3D3算法十分简单,核心是根据“最大信息熵增益”原则选择划分当前数据集的最好特征,信息熵是信息论里面的概念,是信息的度量方式,不确定度越大或者说越混乱,熵就越大。在建立决策树的过程中,根据特征属性划分数据,使得原本“混乱”的数据的熵(混乱度)减少,按照不同特征划分数据熵减少的程度会不一样。在ID3中选择熵减少程度最大的特征来划分数据(贪心),也就是“最大信息熵增益”原则。同时这是最早提出的一种决

2017-08-01 16:55:23 19146 1

原创 Adaboost的原理、推导与实例

本文结合机器学习班决策树与Adaboost 的PPT,跟邹讲Adaboost指数损失函数推导的PPT(第85~第98页)、以及李航的《统计学习方法》等参考资料写。##原理部分基本参考[大神博客](http://blog.csdn.net/v_july_v/article/details/40718799)关于代码实例,我给出了优达学城的简单案例和sklearn 调用的参数选择说明。1 Adabo

2017-07-17 14:46:46 1024

原创 SVM基本概要与sklearn.svm.svc 参数说明

SVM的基本概念先介绍一些简单的基本概念:分隔超平面:将数据集分割开来的直线叫做分隔超平面。超平面:如果数据集是N维的,那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面,也就是分类的决策边界。间隔:一个点到分割面的距离,称为点相对于分割面的距离。数据集中所有的点到分割面的最小间隔的2倍,称为分类器或数据集的间隔。最大间隔:SVM分类器是要找最大的数据集间隔。支持向量:坐落在数据边际的两边

2017-07-12 13:28:53 82121 4

原创 Python 函数参数引用(传值 or 传址)copy和deepcopy

博文结构: 1、传值、传址的概念和区别 2、python 参数传递的方式 3、copy和deepcopy 的使用 4、python的数据存储方式传值、传址的概念和区别:传值:被调函数局部变量改变不会影响主调函数局部变量 传址:被调函数局部变量改变会影响主调函数局部变量传值就是传入一个参数的值,传址就是传入一个参数的地址,也就是内存的地址(相当于指针)。他们的区别是如果函数里面对传入的参数重

2017-06-30 15:38:09 11679 2

原创 Python 刷题日记:LeetCode 204: Count Primes

原题: Description:Count the number of prime numbers less than a non-negative number, n.解题思路:常规解法:因为要求解小于n的素数个数,首先要解决如何判断一个素数。那么就是对于一个数x,只需对[2,]的数进行整除,若能整除则不是素数,不能整除则为素数。然后判断小于n的各个数是否为素数,这样做法的复杂度显然为O(n^2

2017-06-28 21:13:19 6001

原创 Python 刷题日记:LeetCode: 1&15&16-Two Sum and 3Sum

这篇博文整理了关于做2Sum和3Sum的做题心得,这类题目都是给定一个整数数组和一个目标值,然后从数组中找出加和等于目标值的下标或值。LeetCode 1:Two Sum: Given an array of integers, return indices of the two numbers such that they add up to a specific target.You may

2017-06-26 22:12:27 930

原创 Python 刷题日记:LeetCode 5&9&516- Longest Palindromic Substring 题集合

原题:LeetCode 5 Longest Palindromic Substring: Given a string s, find the longest palindromic substring in s. You may assume that the maximum length of s is 1000.Example:Input: "babad"Output: "bab"No

2017-06-25 20:40:45 1760

原创 MAC 上安装LibSVM的python接口

1、下载LibSVM,点击即为下载链接。 我选择的是zip文件。2、将libsvm压缩包解压,然后放在一个特定路径中。然后打开mac终端,进入libsvm的目录,类似”cd /Users/ppj/libsvm-3.22”,执行“make lib”命令,如下图: 3、将执行的libsvm.so.2 复制到/usr/local/lib文件夹下。这个/usr/local/lib文件夹,可能有些小伙

2017-06-23 21:45:02 1796

原创 Python 刷题日记:LeetCode 624. Maximum Distance in Arrays

原题: Given m arrays, and each array is sorted in ascending order. Now you can pick up two integers from two different arrays (each array picks one) and calculate the distance. We define the distance be

2017-06-23 20:18:30 1347

转载 LibSVM学习详细说明

代码文件主要针对Matlab进行说明,但个人仍觉得讲解的支持向量机内容非常棒,可以做为理解这一统计方法的辅助资料;      LibSVM是台湾林智仁(Chih-Jen Lin)教授2001年开发的一套支持向量机的库,这套库运算速度还是挺快的,可以很方便的对数据做分类或回归。由于libSVM程序小,运用灵活,输入参数少,并且是开源的,易于扩展,因此成为目前国内应用最多的SVM的库。这套库可以从ht

2017-06-23 15:26:37 2406

原创 Python刷题日记:LeetCode-Longest Substring Without Repeating Characters

原题: Given a string, find the length of the longest substring without repeating characters.Examples:Given “abcabcbb”, the answer is “abc”, which the length is 3.Given “bbbbb”, the answer is “b”,

2017-06-23 13:53:17 393

原创 Python 刷题日记: Letter Combination of a Phone Number

原题: Given a digit string, return all possible letter combinations that the number could represent. A mapping of digit to letters (just like on the telephone buttons) is given below. (中文翻译:给定一个数字字符串,

2017-06-22 15:47:30 613

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除