自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 社交网络分析(Social Network Analysis)

这周只是讲了一些 Social Network Graph的基本概念: Node Edge(directed edge, undirected edge)IndegreeOutdegree这些概念比较简单,不再重复了。Social Network Graph的表示主要有三种方式:1. Adjacency matrix2. Edge list3. Adja

2013-11-10 23:19:31 17462 2

原创 最短摘要

@陈利人 http://weibo.com/lirenchen#面试题#从一个长字符串中查找包含给定字符集合的最短子串。例如,长串为“aaaaaaaaaacbebbbbbdddddddcccccc”,字符集为{abcd},那么最短子串是“acbebbbbbd”。如果将条件改为“包含且只包含给定字符集合”,你的算法和实现又将如何改动。#include #include #includ

2013-11-08 11:26:10 644

原创 k-means如何选择合适的k?

一般来说是三种思路:1. 根据经验值人工设定.2. 先用canopy跑一遍, 估算出K.3. 对不同的K,画出损失函数随K的变化曲线,选择曲线的拐点对应的K.实际工程中, 往往是先熟悉数据, 根据业务需求人工选定合适的K, 大家有什么好的意见没?

2013-11-08 11:26:08 1379

原创 滑动窗口--单调队列

@陈利人 http://weibo.com/lirenchen#面试题#一个数字数组,给一个窗口,长度为k,窗口从数组头开始往后滑动,每次滑动一个,求每次窗口中的最大值。例如,数组[3, 4, 5, 7, 3, 5, 2, 9] ,k = 3,那么,输出:5 7 7 7 5 9#include #include #include using namespace std;struc

2013-11-08 11:26:06 669

原创 多个文件中的query按照频度排序

@陈利人 http://weibo.com/lirenchen题:有10个文件,每个文件1G,每个文件的每行存放的都是用户的query(请自己随机产生),每个文件的query都可能重复。要求你按照query的频度排序。#!/usr/bin/env python# -*- coding: utf-8 -*-# leijun00@gmail.comimport osimport sy

2013-11-08 11:26:04 1051

原创 从数组中删除这个指定的值

@陈利人http://weibo.com/lirenchen#Facebook面试题#这是一个编程题,动手做做才会有体会。给一个数组和一个值,从数组中删除这个指定的值的所有出现,并且返回新的数组的长度。size_tremove_elem(T* array, size_t len, T elem) {}。#include using namespace std;int remove

2013-11-08 11:26:01 695

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除