自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(70)
  • 收藏
  • 关注

原创 Bloom Filter 和 Count-Min Sketch 介绍

Bloom Filterintroduction首先,我们假设有四种存储设备,分别是 Tape, HDD, SSD, Memory.当然,我们知道,这四种设备的响应速度是按顺序递增的,也就是说 Memory 的速度最快,当然,我们都希望所有的程序都可以跑在 Memory 中,但是这四种设备的存储大小即容量也是不一样的,价格也是随之递增的.Ex .g 当我们在 Java 中使用 Set ...

2018-02-20 07:03:36 4201

翻译 DataSketches Research Directions 流数据相关研究

DataSketches Research Directions  https://datasketches.github.io/docs/Research.html 来源与雅虎的开源项目,翻译by Titanssword 结合自己研究方向,可合并摘要,分位数, k 均值聚类的流式算法, 有关图流处理算法, 有关滑动窗口流算法Introduction在分析海量数据

2018-01-17 03:31:59 939

原创 Kubernetes Local setup

Local-machine SolutionsBefore you beginVT-x or AMD-v virtualization must be enabled in your computer’s BIOS.Install a Hypervisor If you do not already have a hypervisor installed, instal

2018-01-16 01:13:56 326

原创 6.824 Lab1: MapReduce

This is the implementation of 6.824 Lab1: MapReducePart 1: Map/Reduce and outputWhat you have to do is to finish the two function doMap() and doReduce()Each call to doMap() reads the appropria

2018-01-12 07:06:33 532

原创 【leetcode】458. Poor Pigs

【leetcode】458. Poor PigsThere are 1000 buckets, one and only one of them contains poison, the rest are filled with water. They all look the same. If a pig drinks that poison it will die within 15 minut

2017-02-02 19:59:29 1362

原创 【leetcode】100 same tree

先对根节点进行判断是否空,之后比较是否相等,然后进而递归比较左儿子和右儿子是否相等,这里不需要进行判空。# Definition for a binary tree node.# class TreeNode(object):# def __init__(self, x):# self.val = x# self.left = None#

2017-01-24 16:05:40 516

原创 【机器学习基础】Least squares最小二乘法

最小二乘法是求线性回归问题最基础的方法之一,最近花了一点时间深入研究了一下,然后简单的整理一下思路。先从一个简单的例子开始,对于点A(1,1),B(2,2),C(3,2) 拟合出一条直线 y = C + D x首先我们把这三个点带入直线方程,写成矩阵的形式。 现在得到一个矩阵方程 通过矩阵我们得到了两个方程,两个变量对应两个方程组,这样我们可以分别解出这两个方程组,对于斜率D,我们可以得到通过

2016-12-05 15:19:39 6906 1

原创 【机器学习sklearn】pickling

上一篇,我们使用了多种模型去对我们的Training Set进行建模,由于数据量不大,处理的速度还是比较快的,但在现实生活中,我们遇到的问题需要更长时间去处理,如果我们能够把模型保存下来,那么就省取了重复处理的步骤,节省了时间开销。 Python 中的pickle 提供了这种把模型存储下来的方法, 这是我们建立的一个线性回归的模型clf = LinearRegression()clf.fit(

2016-11-28 12:33:34 389

原创 【机器学习sklearn】基于sklearn的股票预测

最近了解学习数据统计,了解到了python的sklearn这个库,集成了很多机器学习的模型,感觉很强大,官网 下面通过一个简单的预测的例子来上手sklearn这个库。 根据pythonprogramming上的例子改写。本次实验使用anaconda的集成环境,故不需要下载所需的包,但需要使用conda命令更新sklearn至官网教程所使用的版本(之前因为版本问题纠结了好久)。如果没有使用anac

2016-11-25 20:25:54 15630 5

原创 【leetcode】415 Add Strings

Python代码,调了几次才AC,有点乱class Solution(object): def addStrings(self, num1, num2): """ :type num1: str :type num2: str :rtype: str """ len1 = len(num1)

2016-11-04 12:47:09 323

原创 【leetcode】412. Fizz Buzz

if else 判断语句的使用,注意熟悉不同语言语法的使用 Python版class Solution(object): def fizzBuzz(self, n): """ :type n: int :rtype: List[str] """ self=[]; for i in range(1,

2016-11-02 13:25:26 321

原创 Python3 zip,lambda,map,reduce的使用

使用Python进行数据处理的时候经常遇到一些Python独有的小函数,使用这些小函数 可以大大减少代码量。Python2中的使用方法与3有些不同,具体参见 这里写链接内容# -*- coding: utf-8 -*-"""Created on Wed Oct 26 11:51:32 2016@author: Jian"""import functoolsa = [1,2,3,4,5]

2016-10-26 20:40:42 1582

原创 Java获取文件夹下的文件名

File file=new File("D:\\DownLoad3\\"); String test[]; test=file.list(); int nums =0; for(int i=0;i<test.length;i++) { System.out.println(test[i]);

2016-10-05 17:12:38 383

原创 使用Java下载网页的下载链接的内容

项目需要大量的excel文件作为数据来源,然后写了一个java小程序用来直接下载网页下载链接的内容。这样使用Java编程可以进行指定任务的下载 导入相应的包import java.io.File;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.

2016-09-27 15:10:45 1489

原创 使用绝对路径和相对路径访问

一、概念区分 相对路径就是相对于当前文件的路径。网页中一般表示路径使用这个方法。 绝对路径就是你的主页上的文件或目录在硬盘上真正的路径。绝对路径就是你的主页上的文件或目录在硬盘上真正的路径 二、符号 同目录文件引用 “.”——代表目前所在的目录。 我们现在建一个源文件info.html,在info.html里要引用index.html文件作为超链接。 假设index.html路径是:c

2016-08-22 20:27:35 2901

原创 Servlet基础

Servlet理解 ① Servlet就是JAVA 类 ② Servlet是一个继承HttpServlet类的类 ③ 这个在服务器端运行,用以处理客户端的请求 Servlet生命周期 –Servlet生命周期就是指创建Servlet实例后,存在的时间以及何时销毁的整个过程. –Servlet生命周期有三个方法   init()方法:   service()方法:Dispatches

2016-08-22 15:02:01 207

原创 JSP基础

jsp的基本概念

2016-08-20 14:06:57 266

原创 【重学Java之路】java环境配置及第一个java程序

虽然用了一段时间的java,但是感觉自己还是没有入门,每次没环境都要去网上看教程,(mdzz明明已经配过那么多个机器了)这次借着给实验室的电脑配环境的功夫,重温一下之前的知识。一、安装JDK,选择对应的版本二、配置环境变量JAVA_HOME  配置JDK安装路径PATH              配置JDK命令文件的位置,即bin的路径CLASSPATH  配置类库

2016-07-03 18:33:42 427

原创 java爬虫 之 搜狐新闻爬虫(三)

有了上两篇的文章,这篇简单的将两篇文章结合起来,得到一个可以抓取,搜狐新闻首页的所有新闻。package com.sohu;import java.io.IOException;import java.util.*;import org.jsoup.*;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import

2016-04-15 18:50:09 550

原创 java爬虫 之 搜狐新闻爬虫(二)

我们可以发现搜狐新闻的新闻页都是有规律的比如: http://news.sohu.com/20160415/n444266195.shtml在浏览器中右键检查元素可以找到锁定文章标题,时间,来源的标签那么经过分析确定标签可以得到下面的代码:Elements h = doc.select("h1[itemprop]");//标题 System.out.println(h.text());

2016-04-15 18:40:31 831

原创 java爬虫 之 搜狐新闻爬虫(一)

最近开始学习java爬虫,网上很多教程,自己找的时候花了好久的时间去理解别人的思路。打算将自己最近的学习进度稍作整理,理清思路。主要工具使用jsoup:具体用法看http://blog.csdn.net/u012315428/article/details/51135640下面是获取一个网页中所有的超链接:package com.sohu;import org.jsoup.Js

2016-04-15 18:24:33 2005

原创 搜狐新闻爬虫

小试身手,爬取搜狐新闻主页面上新闻的内容package com.test1;import java.io.IOException;import org.jsoup.*;import org.jsoup.helper.*;import org.jsoup.nodes.*;import org.jsoup.parser.*;import org.jsoup.select.*;publi

2016-04-12 19:45:51 1925

原创 jsoup的使用

hello在用了一段时间的正则表达式之后,一直想找个机会学习一下jsoup,据说是解析网页的神器,但苦于官方的英文文档。迟迟没有动手自从看了youtube上的jsoup的视频之后,短短几行就实现了之前几十行的任务,(爬取网页上的所有超链接),这坚定了我学习jsoup的决心,结合中文文档和英文文档,花了大概两天的时间,大概了解了一下jsoup的使用,对于正则表

2016-04-12 17:47:08 3853

原创 [leetcode] 42 Trapping Rain Water

具体思路就是先计算所有柱子的面积,然后先从左到右然后从右到左把坑填满,计算一个面积用第二个面积减去第一个面积就是所求,注意各种细节。特殊情况单独讨论。

2016-03-25 20:21:55 443

原创 [leetcode] 27. Remove Element

哈哈,终于遇到一个水题了。class Solution {public:    int removeElement(vector& nums, int val) {        int index=0;        for(int i=0;i        {            if(nums[i]!=val)            {         

2016-03-25 19:07:44 200

原创 [leetcode]4. Median of Two Sorted Arrays

leetcode中hard的题目,但是思路并不难,测试样例2000多个,要考虑到各种情况,不然就会wa具体思路:将两个排序的数组合并为一个数组(中间遇到了一些麻烦,pa,pb两个指针到头的处理,if  if 不能这样使用,严格写成if else if ),最后在排好序的数组中找中位数,这时也需要判断,奇偶性,得到的结果不一样分别处理,修改了1个多小时才把2000多个样例都调试通,思维上还是不够

2016-03-25 14:06:06 247

原创 双亲表示(数组表示)的树的基本操作

//树的构建,遍历,计算节点数,计算叶子节点数的基本操作#include#include#include#include #include#include#includeusing namespace std;#define MAX_TREE_SIZE 100typedef struct { char data; int parent;}PTNode;typ

2016-03-24 18:25:17 487

原创 链表的基本操作

研究生复试要求掌握链表的基本操作,就写了些demo实现了一下。都是简单的操作,是做链表题的基础。#include#include#include#include using namespace std;typedef struct LNode{ int data; struct LNode *next;}LNode, *LinkList;int GetE

2016-03-23 17:38:42 385

原创 【leetcode】 39. Combination Sum

Given a set of candidate numbers (C) and a target number (T), find all unique combinations in C where the candidate numbers sums to T.The same repeated number may be chosen from C unlimited number of

2016-03-19 20:06:21 401

原创 151. Reverse Words in a String

Given an input string, reverse the string word by word.For example,Given s = "the sky is blue",return "blue is sky the".Update (2015-02-12):For C programmers: Try to solve it in-place in

2016-03-18 22:31:12 253

原创 Two Sum

开始想到的方法就是暴力,n2的复杂度后面网上看看资料,发现hash这个方法挺适合的class Solution {public: vector twoSum(vector& nums, int target) { unordered_mapmapping; vectorresult; for (int i=0;i<nums.size

2016-03-15 17:57:17 292

原创 33. Search in Rotated Sorted Array

Search in Rotated Sorted Array My Submissions Question Total Accepted: 92936 Total Submissions: 310089 Difficulty: Hard Suppose a sorted array is rotated at some pivot unknown to you beforehand.(i.e

2016-03-03 21:05:46 256

原创 80. Remove Duplicates from Sorted Array II

Follow up for “Remove Duplicates”: What if duplicates are allowed at most twice?For example, Given sorted array nums = [1,1,1,2,2,3],Your function should return length = 5, with the first five elemen

2016-03-03 20:06:29 251

原创 82. Remove Duplicates from Sorted List II

82. Remove Duplicates from Sorted List IIMy SubmissionsQuestionTotal Accepted: 66613 Total Submissions: 251735 Difficulty: MediumGiven a sorted linked list, delete all nodes that have duplicate number

2016-03-03 15:50:13 32507

原创 24. Swap Nodes in Pairs

24. Swap Nodes in PairsMy SubmissionsQuestionTotal Accepted: 84067 Total Submissions: 243002 Difficulty: MediumGiven a linked list, swap every two adjacent nodes and return its

2016-03-02 20:13:43 222

原创 83. Remove Duplicates from Sorted List

/** * Definition for singly-linked list. * struct ListNode { *     int val; *     ListNode *next; *     ListNode(int x) : val(x), next(NULL) {} * }; */class Solution {public:    Li

2016-03-02 19:09:55 260

原创 正则表达式的使用

2016-2-27常用符号#-*-coding:utf8-*-import re# from re import findall,search,Sprint('hello world')secret_code = 'feafefexxixx23fe23xxlovexxafeifvaxxyouxx32fe'a = 'xz123'b = re.findall('

2016-02-27 21:32:12 280

原创 python beautifulsoup简单用法

#!/usr/bin/env python3# -*- coding: utf-8 -*-from bs4 import BeautifulSoupimport rehtml_doc = """The Dormouse's storyThe Dormouse's storyOnce upon a time there were three little sisters; and

2016-02-24 15:54:25 334

原创 javascript 练习

javascriptbody{font-size:12px;}#txt{    height:400px;    width:600px;border:#333 solid 1px;padding:5px;}p{line-height:18px;text-indent:2em;}  JavaScript课程        JavaSc

2016-02-18 17:45:17 332

原创 python 类和实例

!/usr/bin/env python3-- coding: utf-8 --!/usr/bin/env python3-- coding: utf-8 --class Student(object): def init(self,name,score): self.name =name self.score = score def prin

2016-01-27 17:14:54 364

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除