java
橙虚缘
这个作者很懒,什么都没留下…
展开
-
htmlunit抓取数据的一些总结
最近一直用htmlunit工具来抓数据,完成各类目标网站自动登录抓取各类数据。过程中碰到了各类问题,自己慢慢摸索,但最终还是一一的解决。后面会贴一些代码上来,不至于让文章看看起空荡荡的。 附上一些总结:1.抓取数据主要两种方案:一、模拟浏览器操作 二、抓包,个人在采取两种方案时候会交换使用2.对于有验证码的,个人处理办法:抓取验证码到swing面板,手动输入,后写个窗体定原创 2016-01-05 11:35:52 · 5081 阅读 · 8 评论 -
文字相似度算法
最近项目需要比对文字内容相似度,用了段时间,比较好用package com.yizo.unit;import java.io.UnsupportedEncodingException;import java.util.HashMap;import java.util.Iterator;import java.util.Map;public class Cosine { /**原创 2017-09-18 16:58:11 · 2079 阅读 · 0 评论 -
利用Thrift,实现java、php数据通讯
摘要: Thrift是一个软件框架(远程过程调用框架),用来进行可扩展且跨语言的服务的开发,封装了数据传输格式(二进制、json)和网络通信的服务框架,提供多语言(C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, JavaScript, Node.js, Smalltalk, and OCaml)的网络服务器端和客户端程转载 2017-06-20 10:38:03 · 3603 阅读 · 0 评论 -
phantomjs selenium实现刷搜索引擎,刷百度来路,刷点击,真实有效果
时间仓促,先把之前的测试代码贴上/* * 方案一 模拟搜索百度(打开百度,搜索,下三页,重新搜索,点击前三条任意一条 */ public static void run_one(String search_one, String search_two, int mysqlid) { System.out.println(search_two); Map map = Phon原创 2017-06-05 14:56:16 · 5338 阅读 · 2 评论 -
htmlunit解决内存不断增加,内存溢出问题
内存较为稳定代码:import java.io.IOException;import java.net.MalformedURLException;import com.gargoylesoftware.htmlunit.BrowserVersion;import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeExceptio原创 2017-04-03 19:54:53 · 5494 阅读 · 0 评论 -
生产者/消费者模型
什么是生产者/消费者模型一种重要的模型,基于等待/通知机制。生产者/消费者模型描述的是有一块缓冲区作为仓库,生产者可将产品放入仓库,消费者可以从仓库中取出产品,生产者/消费者模型关注的是以下几个点:1、生产者生产的时候消费者不能消费2、消费者消费的时候生产者不能生产3、缓冲区空时消费者不能消费4、缓冲区满时生产者不能生产生产者/模型作为一种重要的模型,它的优点在于:1、转载 2016-12-24 15:20:29 · 4105 阅读 · 0 评论 -
数据结构之【栈】--复习
学习任何一种技术都应该先清楚它的基本概念,这是学习任何知识的起点!本文是讲述数据结构的基本概念,适合对数据结构已经有一定基础的程序员,更是适合想要学习数据结构的code一族!让我们开始PHP数据结构的篇章吧!一、基本概念(一)编写解决实际问题的程序的一般过程:1.如何用数据形式描述问题,即将问题抽象为一个数学模型;2.问题所涉及到的数据量的大小及数据之间的关系;3.如何在计算机转载 2015-10-30 12:06:58 · 571 阅读 · 0 评论 -
数据结构之【队列】--复习
队列是先进先出的线性表;队列由于是线性表,因此也有顺序存储和链式存储两种实现方式; 一、顺序存储实现 由于队列的特性是:从队尾添加,从对头删除,因此如果让数组的尾部用作队尾,数组的头部用作队头,则删除元素时,时间复杂度为O(n);因此我们需要用循环数组实现,并且维护两个属性 front、rear,front用来记录队头的位置,rear记录队尾的下一个位置;比如:这样转载 2016-06-22 14:57:48 · 308 阅读 · 0 评论 -
数据结构之【线性表】--复习
一、线性表简介 线性表简单地说就是数据元素的序列,即一对一关系; 二、ArrayList简单实现 读取:O(1)插入、删除:O(n)代码实现:package org.xiazdong.list;public class MyArrayList { private static final int DEFAULT_LENGT转载 2016-06-23 08:55:41 · 335 阅读 · 0 评论 -
数据结构之【排序】--复习
排序:对一序列对象根据某个关键字进行排序;稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面; 内排序:所有排序操作都在内存中完成;外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行; 排序耗时的操作:比较、移动;转载 2016-07-01 15:26:50 · 329 阅读 · 0 评论 -
java模拟http服务器
WebServer代码:package test;import java.io.*;import java.net.*;import java.util.*;/** * <p>Title: WEB服务器</p> * <p>Description: 使用Socket创建一个WEB服务器,本程序是多线程系统以提高反应速度。</p> */...原创 2016-05-23 13:04:08 · 874 阅读 · 0 评论 -
java线程之间通讯
package test;/** * Title: 线程间合作 * Description: 本实例使用二个线程共同合作绘制一个实体三角。 */public class MainThread{ public static int flag = 0; int count = 10;/** *方法说明:主方法 *输入参数: *返回类型: */ public stati原创 2016-05-23 13:01:04 · 316 阅读 · 0 评论 -
分治算法的应用,快速排序java实现
快速排序(Quicksort)是对冒泡排序的一种改进。快速排序由C. A. R. Hoare在1962年提出。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。设要排序的数组是A[0]……A[N-1],首先任意选取一个数据(通常选用数...转载 2016-06-08 16:37:38 · 715 阅读 · 0 评论 -
php版des加密解密,真正可用,兼容java
网上搜一大堆,n多用不了,自己修改了下,对接javaclass SecretUtilTools { /** * 解密函数 * 算法:des * 加密模式:ecb * 补齐方法:PKCS5 * @param unknown_type $input */ public static f...原创 2018-05-07 15:33:51 · 6412 阅读 · 0 评论