- 博客(37)
- 收藏
- 关注
原创 java里去掉回车换行符
首先先保证内容开头和尾部没有多余的空格,否则先去掉空格。String result = "name\r\n ";result = result.trim();result = result.replaceAll("\n","");result = result.replaceAll("\r","");
2013-04-26 20:27:32
6969
原创 解决java插入mysql时出现java.sql.SQLException: Incorrect string value: '\xF0...'问题
出现这个问题的主要原因是待插入数据中有特殊字符,导致了插入错误。原因:mysql中规定utf-8字符MaxLen=3,而某些unicode字符转换之后有4个字节,这样就发生了错误解决办法:将待插入字段的类型改为MEDIUMBLOBinsert语句不变,只是在读数据的时候将select content from tt 改为:SELECT CAST(Content AS CHAR CHAR
2013-03-20 16:16:42
1359
原创 每天一点java学习-start
看了CSDN博客专栏“java程序员从笨鸟到菜鸟” 很有感触学习一个东西就是要反复反复反反复复的过程所有我也需要那样,每天进行总结!
2012-10-19 22:17:25
420
转载 java map值排序方法
【转自】http://hooabc.blog.sohu.com/157913008.htmlMap map = new TreeMap();map.put("j2se", 20); map.put("j2ee", 10); map.put("j2me", 30);List> infoIds = new ArrayList>( map.entrySet());
2012-10-19 21:07:33
568
原创 面试题10答案
在2.5亿个整数中找出不重复的整数,内存不足以容纳这2.5亿个整数 这个题网上有答案说用2-bitmap做,但是我不是很懂,有木有亲愿意详细帮我解答下呢!感谢感谢 【网上做法】 采用2-Bitmap(每个数分配2bit,00表示不存在,01表示出现一次,10表示多次,11无意义)进行,共需内存内存,还可以接受。然后扫描这2.5亿个整数,查看Bitmap中相对应位,如果是
2012-10-19 15:25:34
452
原创 面试题9答案
1)首先从海量日志数据中找出这一天访问百度的IP,将这些IP写入一个大文件中 2)然后对于该大文件中的每一个ip,求hash(ip)%1000,这样将这个大文件映射成了1000个小文件 3)遍历这1000个小文件,对于每一个小文件使用hash_map进行频率统计,排序之后选出该小文件中频率最大的IP及相应的频率 4)这样就得到了1000个,最后再从这
2012-10-18 16:30:07
294
原创 我不开心
虽然是技术博客,但是想要吐槽,还是过来了 我不知道最近是个什么状态,马上要毕设开题了,但是完全找不到方向,最要命的是感觉导师已经有忽视我的倾向了,从外校来这里读研已经满一年了,但是感觉还是完全融不进来,读研之后选择了数据挖掘方向的实验室,虽然一切从零开始,但是我真的有很认真的去学习数据挖掘,但是为什么boss就是不相信我有进入项目的能力呢,总是给我一些不轻不重的事情做,让我很挫败,自己学
2012-10-17 21:33:44
509
转载 java求集合的子集算法
【转自】http://blog.163.com/xiaohui_1123@126/blog/static/3980524020109784356915/思路:假设集合S(A,B,C,D),其大小为4,拥有2的4次方个子集,即0-15,二进制表示为0000,0001,...,1111。对应的子集为空集,{D},...,{A,B,C,D}。步骤:1,求出从0到集合子集数目之间的数的二进
2012-10-17 21:08:26
2189
原创 面试题8答案
1)顺序读取文件,对其中每个词x,计算hash(x)%5000,根据得到的hash值我们可以将词存入到5000个小文件中(记为),如果其中有文件的大小大于1M,则继续按相同的方法进行切分。直到所有的小文件的大小都小于1M。 2)对于每个小文件,使用hash_map统计其中出现的每个词以及其出现的频率,然后挑选出出现频率最大的前100个词,并将该100个词及其相应的频率存入新的文件中
2012-10-17 16:11:22
532
原创 面试题7答案
也是考察hash的题目 1)首先顺序读取10个文件,按照hash(query)的结果将query写入另外10个文件,记为 2)对每个文件ai,根据hash(query)的值来统计每个文件中每个query出现的次数,用hash_map(query, query_count)表示,并使用排序算法进行排序,将排好序的query和对应的query_count输出到文件中
2012-10-16 16:15:33
375
原创 面试题7
【百度笔试题】有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。
2012-10-15 16:33:56
398
原创 面试题六答案
我认为实际上此题的考点应该就是hash的技术,网上对于此题的解答有两种方法。 方案一:每个文件存放50亿个url,每个url的大小是64字节,那么每个文件的大小=5G*64=320G,远大于内存的4G,所以不能将文件全部一次性存入内存中,应该采取分治的方法: 1)遍历文件a,对其中的每个url求hash,hash(url)%1000,根
2012-10-15 16:32:25
759
转载 List变成数组, 数组变成List
【转自】http://blog.sina.com.cn/s/blog_637dbdc00100n4l6.html==================================================================================================自己的测试代码:------------------------
2012-10-14 18:16:08
962
原创 面试题五答案
1、重写strcpy函数 原型声明:extern char *strcpy(char *dest,const char *src); 功能:把从src地址开始且含有NULL结束符的字符串赋值到以dest开始的地址空间 返回:返回指向dest的指针 实现:char * strcpy(char * strDest,const char * strSr
2012-10-09 21:34:29
371
转载 java正则表达式基础
【转自】http://www.blogjava.net/vincent/archive/2009/08/13/290913.html java正则表达式最最基础的地方1.字符x 字符 x。例如a表示字符a\\ 反斜线字符。在书写时要写为\\\\。(注意:因为java在第一次解析时,把\\\\解析成正则表达式\\,在第二次解析时再解析为\,所以凡是不是
2012-10-09 21:09:09
533
原创 java 获取键盘输入的方法
java获取键盘输入不如C#方便啊啊! InputStreamReader isr = new InputStreamReader(System.in); BufferedReader br = new BufferedReader(isr); System.out.print("Input: "); String line;
2012-10-09 21:00:10
407
原创 面试题五
Strcpy与memcpy两个函数的实现一、已知strcpy函数的原型是char* strcpy(char* strDest,const char* strSrc);1.不调用库函数,实现strcpy函数2.解释为什么要返回char*;二、不调用库函数,实现memcpy函数
2012-10-05 16:54:55
308
原创 笔试题四+答案
最最基础的笔试题之一.....进程VS线程。。堆VS栈1、进程VS线程 1)进程是具有一定独立功能的程序关于某个数据集上的一次运行活动 2)进程是系统进行资源分配和调度的一个独立的单位 3)线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。 4)线程自己基本不拥有系统资源,但是它可以与同属于一个
2012-10-05 16:07:10
599
转载 笔试题三
【转自】http://blog.csdn.net/yahohi/article/details/7453005题目是:1-20的两个数把和告诉A,积告诉B,A说不知道是多少,B也说不知道,这时A说我知道了,B接着说我也知道了,问这两个数是多少?【这是智力题的一种,现在大公司都好喜欢考这种】分析:设和为S,积
2012-10-05 13:45:14
707
原创 笔试题二【解答】
这个应该算是百度笔试的经典题了,我记得去年打酱油笔试百度实习生的时候就考了这个题,现在再来看看!关于这个题,我觉得应该有几个思考的方法,大家看看觉得哪种好啦!或者有更好的记得分享啦!方法一:【转自】http://www.cnblogs.com/shaosks/archive/2012/05/07/2487602.html 该作者认为判断词A和词B是否是兄弟单词就是看组成A和B两
2012-10-05 13:26:19
336
原创 笔试题二
来自百度实习笔试题(2012.5.6) 一个单词单词字母交换,可得另一个单词,如army->mary,成为兄弟单词。提供一个单词,在字典中找到它的兄弟。描述数据结构和查询过程。 【这个我怎么感觉以前做单词拼写检查的时候用到过,恩恩,慢慢想想!】
2012-09-25 15:44:04
443
原创 笔试题一【解答】
这个题目是在http://topic.csdn.net/u/20120820/23/C6B16CCF-EE15-47C0-9B15-77497291F2B9.html里面找到的,是一个帖子,查看了跟帖的大牛们的答复,自己也简单想了一下,如果我们只考虑两类表均在一个服务器上存储着,那么我觉得最好的方法应该就是建一个临时表,将第2类表中的30张表的userid去重的插入到临时表中,然后将第一类数据表与
2012-09-25 15:40:58
421
原创 笔试题一
2012-09-24【金山笔试题】数据库1中存放着a类数据,数据库2中存放着以天为单位划分的表30张(比如table_20110909,table_20110910,table_20110911),总共是一个月的数据。表1中的a类数据中有一个字段userid来唯一判别用户身份,表2中的30张表(每张表结构相同)也有一个字段userid来唯一识别用户身份。如何判定a类数据库的多少用户在数据库
2012-09-24 21:48:46
387
原创 禁用word 2007里面的信息检索功能
今天帮姐姐整论文格式,不知道发神经按了什么,启用了word的信息检索功能,各种不能用啊,烦躁 google之,解决问题很简单:按ALT+A即可!!
2012-09-24 21:35:37
895
原创 如何将mysql的默认datadir改变成自己想要的路径
今天一个晚上都在折腾这个,好不容易解决了,记录下来首先按照正常步骤进行mysql的安装之后,发现datadir的默认目录是C:\Documents and Settings\All Users\Application Data\MySQL\MySQL Server 5.1\data本来C盘容量就不多,当然不能放在这个里面~~所以按照网上的步骤,在my.ini文件中进行了修改,然后在“服
2012-08-17 19:33:22
6868
1
原创 JAVA List去重问题解决
关于java的List去重,经常会用到,记录一下://需要去重的list为user_idfor(int i=0;i for(int j=user_id.size()-1;j>i;j--){ if(user_id.get(j).equals(user_id.get(i))){ user_id.remove(j);
2012-08-12 13:33:51
777
原创 java读写文件,读超大文件
一直在处理爬虫,经常能遇到读写文件的操作,很多时候都是读写超大文件,记录如下:一、读文件 import java.io.BufferedOutputStream; import java.io.BufferedReader; import java.io.File; import java.io.FileOutputStream; import
2012-08-12 13:27:54
31748
2
原创 怎样解决Mysql中文乱码问题
这个问题已经是第n次遇到了,每次mysql安装到一个新的电脑上,就会反复出现这个问题,现在记录起来~~【解决问题】一般就是从my.ini着手,设置如下:[client]default-character-set=utf8[mysql]default-character-set=utf8[mysqld]default-character-set=utf8
2012-08-12 13:05:01
544
原创 几个简单的linux下操作的命令
在实习期间,经常用到的几个命令1、终止线程 kill -9 进程号2、查看某进程 ps -ef|grep 进程名3、删除文件夹及其下面的文件 rm -rf 文件名/ 【rm -rf DDutyManage/】
2012-08-12 13:01:36
320
原创 开始技术博客之旅
最近发现自己很大的一个缺点每次解决了一个问题,一个bug之后不喜欢去把解决方法去记录下来,这样导致了以后遇到相同的问题,又要继续去baidu,google所以决定从现在开始,无论bug的大小,通通记录在这里!!
2012-08-12 12:59:30
391
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人