dengqiaodey-CSDN博客

原创 java里去掉回车换行符

首先先保证内容开头和尾部没有多余的空格，否则先去掉空格。String result = "name\r\n ";result = result.trim();result = result.replaceAll("\n","");result = result.replaceAll("\r","");

2013-04-26 20:27:32 7072

原创解决java插入mysql时出现java.sql.SQLException: Incorrect string value: '\xF0...'问题

出现这个问题的主要原因是待插入数据中有特殊字符，导致了插入错误。原因：mysql中规定utf-8字符MaxLen=3，而某些unicode字符转换之后有4个字节，这样就发生了错误解决办法：将待插入字段的类型改为MEDIUMBLOBinsert语句不变，只是在读数据的时候将select content from tt 改为：SELECT CAST(Content AS CHAR CHAR

2013-03-20 16:16:42 1583

原创每天一点java学习-start

看了CSDN博客专栏“java程序员从笨鸟到菜鸟” 很有感触学习一个东西就是要反复反复反反复复的过程所有我也需要那样，每天进行总结！

2012-10-19 22:17:25 464

转载 java map值排序方法

【转自】http://hooabc.blog.sohu.com/157913008.htmlMap map = new TreeMap();map.put("j2se", 20); map.put("j2ee", 10); map.put("j2me", 30);List> infoIds = new ArrayList>( map.entrySet());

2012-10-19 21:07:33 607

原创面试题10答案

在2.5亿个整数中找出不重复的整数，内存不足以容纳这2.5亿个整数这个题网上有答案说用2-bitmap做，但是我不是很懂，有木有亲愿意详细帮我解答下呢！感谢感谢【网上做法】采用2-Bitmap（每个数分配2bit，00表示不存在，01表示出现一次，10表示多次，11无意义）进行，共需内存内存，还可以接受。然后扫描这2.5亿个整数，查看Bitmap中相对应位，如果是

2012-10-19 15:25:34 491

原创面试题10

在2.5亿个整数中找出不重复的整数，内存不足以容纳这2.5亿个整数。

2012-10-18 16:31:26 467

原创面试题9答案

1）首先从海量日志数据中找出这一天访问百度的IP，将这些IP写入一个大文件中 2）然后对于该大文件中的每一个ip，求hash(ip)%1000，这样将这个大文件映射成了1000个小文件 3）遍历这1000个小文件，对于每一个小文件使用hash_map进行频率统计，排序之后选出该小文件中频率最大的IP及相应的频率 4）这样就得到了1000个，最后再从这

2012-10-18 16:30:07 329

原创我不开心

虽然是技术博客，但是想要吐槽，还是过来了我不知道最近是个什么状态，马上要毕设开题了，但是完全找不到方向，最要命的是感觉导师已经有忽视我的倾向了，从外校来这里读研已经满一年了，但是感觉还是完全融不进来，读研之后选择了数据挖掘方向的实验室，虽然一切从零开始，但是我真的有很认真的去学习数据挖掘，但是为什么boss就是不相信我有进入项目的能力呢，总是给我一些不轻不重的事情做，让我很挫败，自己学

2012-10-17 21:33:44 559

转载 java求集合的子集算法

【转自】http://blog.163.com/xiaohui_1123@126/blog/static/3980524020109784356915/思路：假设集合S（A,B,C,D），其大小为4，拥有2的4次方个子集，即0-15，二进制表示为0000，0001，...，1111。对应的子集为空集，{D}，...，{A,B,C,D}。步骤：1，求出从0到集合子集数目之间的数的二进

2012-10-17 21:08:26 2251

原创面试题9

【百度笔试题】海量日志数据，提取出某日访问百度次数最多的那个IP。

2012-10-17 16:18:14 452

原创面试题8答案

1）顺序读取文件，对其中每个词x，计算hash(x)%5000，根据得到的hash值我们可以将词存入到5000个小文件中（记为），如果其中有文件的大小大于1M，则继续按相同的方法进行切分。直到所有的小文件的大小都小于1M。 2）对于每个小文件，使用hash_map统计其中出现的每个词以及其出现的频率，然后挑选出出现频率最大的前100个词，并将该100个词及其相应的频率存入新的文件中

2012-10-17 16:11:22 577

原创面试题8

【百度笔试题】有一个1G大小的一个文件，里面每一行是一个词，词的大小不超过16字节，内存限制大小是1M。返回频数最高的100个词。

2012-10-16 19:19:27 383

原创面试题7答案

也是考察hash的题目 1）首先顺序读取10个文件，按照hash(query)的结果将query写入另外10个文件，记为 2）对每个文件ai，根据hash(query)的值来统计每个文件中每个query出现的次数，用hash_map(query, query_count)表示，并使用排序算法进行排序，将排好序的query和对应的query_count输出到文件中

2012-10-16 16:15:33 419

原创面试题7

【百度笔试题】有10个文件，每个文件1G，每个文件的每一行存放的都是用户的query，每个文件的query都可能重复。要求你按照query的频度排序。

2012-10-15 16:33:56 440

原创面试题六答案

我认为实际上此题的考点应该就是hash的技术，网上对于此题的解答有两种方法。方案一：每个文件存放50亿个url，每个url的大小是64字节，那么每个文件的大小=5G*64=320G，远大于内存的4G，所以不能将文件全部一次性存入内存中，应该采取分治的方法： 1）遍历文件a，对其中的每个url求hash，hash(url)%1000，根

2012-10-15 16:32:25 802

原创面试题六

【百度实习笔试】给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url？

2012-10-14 21:21:29 776

转载 List变成数组，数组变成List

【转自】http://blog.sina.com.cn/s/blog_637dbdc00100n4l6.html==================================================================================================自己的测试代码：------------------------

2012-10-14 18:16:08 1001

原创面试题五答案

1、重写strcpy函数原型声明：extern char *strcpy(char *dest,const char *src); 功能：把从src地址开始且含有NULL结束符的字符串赋值到以dest开始的地址空间返回：返回指向dest的指针实现：char * strcpy(char * strDest,const char * strSr

2012-10-09 21:34:29 423

转载 java正则表达式基础

【转自】http://www.blogjava.net/vincent/archive/2009/08/13/290913.html java正则表达式最最基础的地方1.字符x 字符 x。例如a表示字符a\\ 反斜线字符。在书写时要写为\\\\。（注意：因为java在第一次解析时,把\\\\解析成正则表达式\\，在第二次解析时再解析为\，所以凡是不是

2012-10-09 21:09:09 570

原创 java 获取键盘输入的方法

java获取键盘输入不如C#方便啊啊！ InputStreamReader isr = new InputStreamReader(System.in); BufferedReader br = new BufferedReader(isr); System.out.print("Input: "); String line;

2012-10-09 21:00:10 442

原创面试题五

Strcpy与memcpy两个函数的实现一、已知strcpy函数的原型是char* strcpy(char* strDest,const char* strSrc);1.不调用库函数，实现strcpy函数2.解释为什么要返回char*;二、不调用库函数，实现memcpy函数

2012-10-05 16:54:55 345

原创笔试题四+答案

最最基础的笔试题之一.....进程VS线程。。堆VS栈1、进程VS线程 1）进程是具有一定独立功能的程序关于某个数据集上的一次运行活动 2）进程是系统进行资源分配和调度的一个独立的单位 3）线程是进程的一个实体，是CPU调度和分派的基本单位，它是比进程更小的能独立运行的基本单位。 4）线程自己基本不拥有系统资源，但是它可以与同属于一个

2012-10-05 16:07:10 633

转载笔试题三

【转自】http://blog.csdn.net/yahohi/article/details/7453005题目是：1-20的两个数把和告诉A,积告诉B，A说不知道是多少，B也说不知道，这时A说我知道了，B接着说我也知道了，问这两个数是多少？【这是智力题的一种，现在大公司都好喜欢考这种】分析：设和为S，积

2012-10-05 13:45:14 752

原创笔试题二【解答】

这个应该算是百度笔试的经典题了，我记得去年打酱油笔试百度实习生的时候就考了这个题，现在再来看看！关于这个题，我觉得应该有几个思考的方法，大家看看觉得哪种好啦！或者有更好的记得分享啦！方法一：【转自】http://www.cnblogs.com/shaosks/archive/2012/05/07/2487602.html 该作者认为判断词A和词B是否是兄弟单词就是看组成A和B两

2012-10-05 13:26:19 371

原创笔试题二

来自百度实习笔试题（2012.5.6）一个单词单词字母交换，可得另一个单词，如army->mary，成为兄弟单词。提供一个单词，在字典中找到它的兄弟。描述数据结构和查询过程。【这个我怎么感觉以前做单词拼写检查的时候用到过，恩恩，慢慢想想！】

2012-09-25 15:44:04 478

这个题目是在http://topic.csdn.net/u/20120820/23/C6B16CCF-EE15-47C0-9B15-77497291F2B9.html里面找到的，是一个帖子，查看了跟帖的大牛们的答复，自己也简单想了一下，如果我们只考虑两类表均在一个服务器上存储着，那么我觉得最好的方法应该就是建一个临时表，将第2类表中的30张表的userid去重的插入到临时表中，然后将第一类数据表与

2012-09-25 15:40:58 460

原创笔试题一

2012-09-24【金山笔试题】数据库1中存放着a类数据，数据库2中存放着以天为单位划分的表30张（比如table_20110909,table_20110910,table_20110911）,总共是一个月的数据。表1中的a类数据中有一个字段userid来唯一判别用户身份，表2中的30张表（每张表结构相同）也有一个字段userid来唯一识别用户身份。如何判定a类数据库的多少用户在数据库

2012-09-24 21:48:46 417

原创禁用word 2007里面的信息检索功能

今天帮姐姐整论文格式，不知道发神经按了什么，启用了word的信息检索功能，各种不能用啊，烦躁 google之，解决问题很简单：按ALT+A即可！！

2012-09-24 21:35:37 935

原创要开始各种做笔试题啦

虽然明年才开始找工作，不过要养成不要在笔试中当炮灰的风格，从现在开始，每天要做一题笔试题！

2012-09-24 21:32:29 367

原创 Mysql中随机挑选指定数量的数据

select * from [表名] order by rand() limit 数量

2012-09-17 14:48:24 1386

原创如何将mysql的默认datadir改变成自己想要的路径

今天一个晚上都在折腾这个，好不容易解决了，记录下来首先按照正常步骤进行mysql的安装之后，发现datadir的默认目录是C:\Documents and Settings\All Users\Application Data\MySQL\MySQL Server 5.1\data本来C盘容量就不多，当然不能放在这个里面~~所以按照网上的步骤，在my.ini文件中进行了修改，然后在“服

2012-08-17 19:33:22 6988

原创 XP下怎样删除服务

开始——运行——cmd.exe输入 sc delete 服务名称

2012-08-17 19:27:18 533

原创 JAVA List去重问题解决

关于java的List去重，经常会用到，记录一下：//需要去重的list为user_idfor(int i=0;i for(int j=user_id.size()-1;j>i;j--){ if(user_id.get(j).equals(user_id.get(i))){ user_id.remove(j);

2012-08-12 13:33:51 807

原创 java读写文件，读超大文件

一直在处理爬虫，经常能遇到读写文件的操作，很多时候都是读写超大文件，记录如下：一、读文件 import java.io.BufferedOutputStream; import java.io.BufferedReader; import java.io.File; import java.io.FileOutputStream; import

2012-08-12 13:27:54 31907

原创怎样解决Mysql中文乱码问题

这个问题已经是第n次遇到了，每次mysql安装到一个新的电脑上，就会反复出现这个问题，现在记录起来~~【解决问题】一般就是从my.ini着手，设置如下：[client]default-character-set=utf8[mysql]default-character-set=utf8[mysqld]default-character-set=utf8

2012-08-12 13:05:01 592

原创几个简单的linux下操作的命令

在实习期间，经常用到的几个命令1、终止线程 kill -9 进程号2、查看某进程 ps -ef|grep 进程名3、删除文件夹及其下面的文件 rm -rf 文件名/ 【rm -rf DDutyManage/】

2012-08-12 13:01:36 349

原创开始技术博客之旅

最近发现自己很大的一个缺点每次解决了一个问题，一个bug之后不喜欢去把解决方法去记录下来，这样导致了以后遇到相同的问题，又要继续去baidu，google所以决定从现在开始，无论bug的大小，通通记录在这里！！

2012-08-12 12:59:30 417

dengqiaodey的专栏