- 博客(501)
- 资源 (104)
- 收藏
- 关注
原创 【集体智慧编程 学习笔记】统计订阅源中的单词数
几乎所有的博客都可以在线阅读,或者通过RSS订阅源进行阅读。RSS订阅源是一个包含博客及其所有文章条目信息的简单的XML文档。程序中使用了feedparser第三方模块,可以轻松地从任何RSS或Atom订阅源中得到标题、链接和文章的条目。完整代码如下:01'''02Created on Jul 14,
2012-07-16 09:16:55
3908
原创 2012微软暑期实习生笔试题
2012 Microsoft Intern Hiring Written Test1. Suppose that a Selection Sort of 80 items has completed 32 iterations of the main loop. How many items are now guaranteed to be in their final spot (nev
2012-07-05 12:09:56
2634
原创 Linux下三国杀聊天窗口乱码 解决方法
Ubuntu: sudo apt-get install ttf-arphic-umingFedora:sudo yum install cjkuni-uming-fonts然后打开http://web.sanguosha.com/ 测试,如果不行请重启电脑。 PS:本人测试后发现安装字体只能解决Firefox下面的乱码,但无法解决Chrome浏览器下面的问题。
2012-07-04 09:18:13
3821
原创 【集体智慧编程 学习笔记】 推荐系统构建
本文构建了一个简单的推荐系统,使用的数据是真实的数据,叫作MovieLens,来自University of Minnesota‘s GroupLens项目组。代码以Python作为实现语言,使用版本为Python2.7。loadMovieData:用于数据的读取。userData指的是以userId为键构建的电影评分列表。movieData值的是以movieId为键构建的电影评分列表。
2012-07-02 13:03:33
3152
原创 【集体智慧编程 学习笔记】 协同过滤技术
协同过滤技术可以分为三类:基于用户(User-based)的协同过滤;基于项目(Item-based)的协同过滤;基于模型(Model-based)的协同过滤。 基于用户(User-based)的协同过滤 用相似统计的方法得到具有相似爱好或者兴趣的相邻用户,所以称之为以用户为基础(User-based)的协同过滤或基于邻居的协同过滤(Neighbor-based C
2012-07-02 13:01:46
2066
原创 【集体智慧编程 学习笔记】 Euclidean距离和Pearson相关系数
Euclidean距离定义:欧几里得空间中点 x = (x1,…,xn) 和 y = (y1,…,yn) 之间的距离为Euclidean距离公式Pearson相关系数两个变量之间的相关系数越高,从一个变量去预测另一个变量的精确度就越高,这是因为相关系数越高,就意味着这两个变量的共变部分越多,所以从其中一个变量的变化就可越多地获知另一个变量的变
2012-06-24 20:48:19
4032
原创 【IT笔试面试题整理】笔试和面试中常见的智力题
【试题描述】你让工人为你工作7天,给工人的回报是一根金条。金条平分成相连的7段,你必须在每天结束时给他们一段金条,如果只许你两次把金条弄断,你如何给你的工人付费?分为1、2、4 三段。Day1:给1Day2:给2,还1Day3:给1Day4:给4,还1、2Day5:给1,还2Day6:给2,还1Day7:给1 【试题描
2012-06-24 20:45:44
4568
原创 【IT笔试面试题整理】海盗分宝石
【试题描述】5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。他们决定这么分:1.抽签决定自己的号码(1,2,3,4,5)2.首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼3.如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行
2012-06-24 20:43:56
1618
原创 【资料整理】C语言位运算总结
位操作基础基本的位操作符有与、或、异或、取反、左移、右移这6种,它们的运算规则如下所示:符号描述运算规则&与两个位都为1时,结果才为1|或两个位都为0时,结果才为0^异或
2012-06-24 20:42:03
3296
原创 中文语料库整理
中文自然语言处理开放平台由中国科学院计算技术研究所·数字化室&软件室创立一个研究自然语言处理的一个平台,里面包含有大量的训练测试语料。语料库: http://www.nlp.org.cn/docs/doclist.php?cat_id=9&type=15文本语料库: http://www.nlp.org.cn/docs/doclist.php?cat_id=16&type=15
2012-06-15 12:46:53
7807
原创 英文语料库整理
Reuters-21578 语料下载Reuters-21578中文说明Reuters-21578 语料库SGML转txt脚本(Python)Reuters-21578 语料库SGML转txt脚本(ruby) 常用英文语料库下载本语料库由University of California整理,里面包含20newsgroups,reuters21
2012-06-15 12:44:30
4609
1
原创 adobe flash player设置时无法点击允许的解决方法
解决方法1)右键点击进行“全局设置”2)自动进入网址:http://www.macromedia.com/support/documentation/en/flashplayer/help/settings_manager.html3)点击下方:Website Storage Settings panel进入全局设置页面4)选中将所需要的网站,进行设置即可
2012-06-05 21:41:33
26596
1
原创 Fedora 常用软件推荐
系统工具1)安装自动选择最快镜像插件安装插件fastestmirror,可以让yum管理器自动搜索最快源下载sudo yum -y install yum-fastestmirror2)添加rpmfusion源sudo yum rpm -ivh http://download1.rpmfusion.org/free/fedora/rpmfusion-free-release
2012-06-05 10:50:58
4545
原创 Cannot retrieve metalink for repository: fedora. Please verify its path and try again 解决方法
执行如下命令:su -c “sed -i ‘s|^#baseurl|baseurl| ; s|^mirrorlist|#mirrorlist|’ /etc/yum.repos.d/*”转载请注明: 转载自阿龙の异度空间 http://www.yidooo.net/本文链接地址: http://www.yidooo.net/archives/2451.html
2012-06-05 10:17:44
7547
原创 Error importing repomd.xml for updates: Damaged repomd.xml file 解决方法
yum执行时出现错误:Error importing repomd.xml for updates: Damaged repomd.xml file解决方法:重新下载:http://mirrors.sohu.com/fedora/releases/16/Everything/i386/os/repodata/repomd.xml覆盖到/var/cache/yum/i38
2012-06-05 10:17:03
18474
原创 Javascript 小数取整函数
1)Math.round(x)round() 方法可把一个数字四舍五入。2)Math.floor(x)floor() 方法执行的是向下取整计算,它返回的是小于或等于函数参数,并且与之最接近的整数。3)Math.ceil(x)ceil() 方法执行的是向上取整计算,它返回的是大于或等于函数参数,并且与之最接近的整数。转载请注明: 转载自阿龙の异度空间本文链
2012-05-24 17:50:23
2126
原创 Javascript 删除字符串空格
1)删除左右两端的空格function trim(str){return str.replace(/(^\s*)|(\s*$)/g, "");2) 删除左边的空格function ltrim(str){return str.replace(/(^\s*)/g,"");}3) 删除右边的空格function rtrim(str){return st
2012-05-24 17:49:22
1004
原创 【Killua笔试面试题整理】两个数组a[N],b[N],其中A[N]的各个元素值已知,现给b[i]赋值
【题目描述】两个数组a[N],b[N],其中A[N]的各个元素值已知,现给b[i]赋值,b[i] = a[0]*a[1]*a[2]...*a[N-1]/a[i];要求:1.不准用除法运算2.除了循环计数值,a[N],b[N]外,不准再用其他任何变量(包括局部变量,全局变量等)3.满足时间复杂度O(n),空间复杂度O(1) 【题目来源】腾讯2012 【题目分析
2012-04-10 13:01:01
3294
原创 Fedora TexLive安装及中文环境配置
OS:Fedora 16TexLive Version: TexLive 20111)添加rpm源 sudo rpm -i http://jnovy.fedorapeople.org/texlive/2011/packages.fc16/texlive-release.noarch.rpm (其他版本可以到http://jnovy.fedorapeople.org/找下对应源)
2012-02-07 13:18:45
4517
原创 系统上未找到用于创建 RPM 包的 RPM 工具 (rpmbuild)解决方法
安装rpm-build包 yum install rpm-build
2012-02-07 13:10:56
6077
1
原创 Subclipse启动出现unable to load default svn client的解决办法
安装SVNKithttp://svnkit.com/download.phpWindow > Preferences, Team > SVN and change there the JavaHL client to SVNKit. Restart.
2012-02-07 13:09:43
7234
原创 解决Fedora安装Virtualbox后无法运行
在Fedora下安装了Virtualbox,发现运行时出现以下问题:Kernel driver not installed (rc=-1908)The VirtualBox Linux kernel driver (vboxdrv) is either not loaded or there is a permission problem with /dev/vboxdrv. Please
2012-02-07 13:08:40
4448
原创 Fedora 16 安装后配置
安装自动选择最快镜像插件 安装插件fastestmirror,可以让yum管理器自动搜索最快源下载 sudo yum -y install yum-fastestmirror添加rpmfusion源 sudo yum rpm -ivh http://download1.rpmfusion.org/free/fedora/rpmfusion-free-release-s
2012-02-07 13:00:59
4251
原创 【Killua笔试题面试题整理】n是一个奇数,求证n(n^2-1)能被24整除
【试题描述】n是一个奇数,求证n(n^2-1)能被24整除 【试题来源】网易 【试题分析】令n=2k + 1,则n(n^2 - 1) = (2k + 1)((2k + 1)^2 - 1) = 4k(k + 1)(2k + 1) = 4*6(1^2+ 2^2 + 3^2 … k^2)因此n(n^2-1)能被24整除
2012-01-28 23:50:50
1509
原创 12306支付出错:交易失败!代码:50050描述:交易信息不完整
下好订单点击支持提示:交易失败!代码:50050描述:交易信息不完整。解决方案(此处以IE 9为例):1)点击“设置”,点击“Internet Explorer选项”2)点击“安全”,“受信任站点”3)添加“添加受信任站点”转载请注明: 转载自阿龙の异度空间本文链接地址: http://www.yidooo.net/arc
2012-01-28 13:04:06
61653
1
原创 编辑距离算法 Levenshtein Distance
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。因此也叫Levenshtein Distance,常用来衡量字符串
2012-01-08 22:34:57
1605
原创 Windows Server 2008 IIS 7.0 安装 (图解)
1)点击“服务器管理器” 2)点击“角色”->“添加角色” 3)点击“下一步” 4)选中“Web服务器(IIS)” 5)点击“添加必需的功能”,点击下一步 6)点击“下一步” 7)选中“应用程序开发”->“ASP.NET”以及“FTP发布服务” 8)点击安装 9)测试IIS,在IE中输入http://localhost/,出席下
2012-01-07 00:32:13
1315
原创 Windows Server 2008 安装(图解)
1)语言选择,点击“下一步” 2)点击“现在安装” 3)选择所要安装的版本,点击“下一步” 4)勾起“我接受许可条款”,点击“下一步” 5)点击“自定义(高级)” 6)选择安装位置,点击“下一步” 7)开始安装 8)首次登录需修改密码 9)修改密码(密码需包含大写字母,小写字母,数字,长度超过8位)
2012-01-06 23:52:37
1182
原创 【Killua笔试面试题整理】有序矩阵查找值
【试题描述】在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。(PS:数组的不一定是n*n的矩阵) 【试题来源】未知 【试题分析】总体思路就是使用递归+二分查找的方法,具体过程如下所示:设二分查找的中间点为(m_x,m_y),其中m_x = (s_x
2011-12-29 12:55:53
1343
转载 将优酷视频订阅到Google Reader的方法
1 、搜索订阅优酷中进行“视频搜索”的,如排行榜里的种种是是非非,如成龙等人的优酷,非本人视频空间,而是大量网友的上传后进行的视频搜索整合得到,都可通过复制网址订阅。2、专辑订阅进入专辑首页,网址里后缀中为id_*****。直接复制网址到google reader的添加订阅即可。3、个人视频空间全部视频订阅:由于优酷像新浪微博一样屏蔽了用户的真实id,导致直接复制网
2011-11-28 00:23:35
1676
原创 ORACLE SQL 前端补“0”
1)LPAD方法:SELECT LPAD(sal,8,'0') FROM emp;2)TO_CHAR 方法SELECT TO_CHAR(sal,'00000000') from emp;3)SUBSTR方法SELECT SUBSTR('00000000'||sal,-8) FROM emp;============================================
2011-11-27 16:37:56
1424
原创 Oracle查询结果自动生成序号
一般情况下,可以如下: select rownum, a from A; 但是当后面有多表关联,order by排序的时候, select rownum, a from A,B where A.a=B.b order by A.a;rownum就可能会乱了。 这时候,可以利用分析函数rank()来实现: select rank() over(order by
2011-11-27 16:26:08
22104
原创 PyLucene学习笔记 文件索引及检索
一、使用Indexer建立文本文件索引 这里简化为对某一目录下面的所有后缀为“.py”的文件建立索引。'''Created on 2011-11-16@author: killua@E-mail:killua_hzl@163.com'''import osfrom time import timefrom datetime import timedelta
2011-11-21 00:22:32
1791
原创 【Killua笔试面试题整理】连翻7张日历之和为138
【试题描述】有一名员工发现日历已经7天没有翻了,于是他连着翻了7页,7天的总和刚好是138,问这一天是几号? 【试题分析】1)假设7天在同一个月,设第一天为X,那么应该满足等差数列之和(2X+6)*7/2 = 138,得到的X不为整数,所以应该是跨两个月。2) 假设跨到第二个月1号,那么天数之和应该为(2X+5)*6 + 1 = 138,不满足条件3) 假设跨到第二个月2号
2011-10-18 12:12:03
1270
原创 【Killua笔试面试题整理】由随机函数rand7构造rand10
【试题描述】已知有个rand7()的函数,返回1到7随机自然数,让利用这个rand7()构造rand10()随机1~10。 【试题分析】1)要保证rand10()在整数1-10的均匀分布,可以构造一个1-10*n的均匀分布的随机整数区间(n为任何正整数)。假设x是这个1-10*n区间上的一个随机整数,那么x%10+1就是均匀分布在1-10区间上的整数。2)接下来利用(rand7
2011-10-09 12:33:25
2488
原创 VirtualBox 虚拟机主机时间不同步设置
用dos进入到VirtualBox的安装目录下,找到VBoxManage.exe执行:VBoxManage.exe setextradata WinXP_JP "VBoxInternal/Devices/VMMDev/0/Config/GetHostTimeDisable
2011-09-01 08:18:58
5690
1
原创 POJ 1659 Frogs' Neighborhood
Description未名湖附近共有N个大小湖泊L1, L2, ..., Ln(其中包括未名湖),每个湖泊Li里住着一只青蛙Fi(1 ≤i ≤ N)。如果湖泊Li和Lj之间有水路相连,则青蛙Fi和Fj互称为邻居。现在已知每只青蛙的邻居数目x1,x2, ...,
2011-08-08 14:14:35
901
原创 POJ 1493 Machined Surfaces
DescriptionAn imaging device furnishes digital images of two machined surfaces that eventually will be assembled in contact with each othe
2011-08-08 14:13:31
989
原创 POJ 1056 IMMEDIATE DECODABILITY
DescriptionAn encoding of a set of symbols is said to be immediately decodable if no code for one symbol is the prefix of a code for anoth
2011-08-08 14:12:07
960
原创 POJ 1250 Tanning Salon
DescriptionTan Your Hide, Inc., owns several coin-operated tanning salons. Research has shown that if a customer arrives and there are no
2011-08-08 14:10:15
1109
A Programmer's Introduction to C# - APress.pdf
2011-08-01
软件工程师日语仕様書
2011-07-21
Django-1-2-PDF-Documentation-For-Offline-Reading.pdf
2010-06-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人