综合
文章平均质量分 74
无限大地NLP_空木
这个作者很懒,什么都没留下…
展开
-
hive——常用
hive 一些常用基础函数原创 2022-01-22 23:44:06 · 2084 阅读 · 0 评论 -
匹配算法——相亲男女匹配
时间:20210928背景:有个相亲活动,需要暗地里给男女进行匹配,毕竟明面上直接说不喜欢哪个异性总是尴尬的。匹配的话,方法众多,并不能让每个人都满意,根据各自的意向,总能计算整体意向都不错的。太长了不看,直接操作:线下让N对男女:写个小纸条,各自给N个异性排序,更喜欢的排在前面 得到: 女生的选择:womanChoices 女1:男2,男5,男1,.... 女2:... ... 女N:... 男生的选择:manChoices 同理 操作:原创 2021-09-28 22:22:35 · 3737 阅读 · 0 评论 -
MAC xcode开发快捷键
Xcode使用入门:http://blog.163.com/lyzaily@126/blog/static/42438837200972903444447/XCoder中的快捷键:Command + [ ] : 整行代码向左或向右缩进在Xcode中写代码,Xcode编辑器常常给出提示,如果给出的代码提示符合我们的要求,我们就可以按tab键选择所提示的代码 。如果提示代码不符转载 2014-04-18 17:07:04 · 851 阅读 · 0 评论 -
java xml---建立一个XML文档
/** * 建立一个XML文档,文档名由输入属性决定 * @param filename 需建立的文件名 * @return 返回操作结果, 0表失败, 1表成功 */ public int createXMLFile(String filename){ /** 返回操作结果, 0表失败, 1表成功 */ int returnValue = 0; /转载 2014-05-05 14:57:57 · 745 阅读 · 0 评论 -
研一上学期各门考试吐槽---师兄只能帮你到这里了
时间:2014年11月16研一上半年原创 2014-11-16 18:20:44 · 1336 阅读 · 0 评论 -
开头15秒最重要:教你如何让presentation引人入胜
开头15秒最重要:教你如何让presentation引人入胜It takes an audience about 15 seconds (at most) to decide whether your presentation is worth their attention. Fritter away those fifteen seconds and your audience w转载 2014-10-30 10:29:20 · 977 阅读 · 0 评论 -
十月百度,阿里巴巴,迅雷搜狗最新面试十一题
http://blog.csdn.net/v_july_v/article/details/6855788引言 当即早已进入10月份,十一过后,招聘,笔试,面试,求职渐趋火热。而在这一系列过程背后浮出的各大IT公司的笔试/面试题则蕴含着诸多思想与设计,细细把玩,思考一番亦能有不少收获。 上个月,本博客着重整理九月腾讯,创新工场,淘宝等公司最新面试十转载 2014-11-17 11:09:04 · 1013 阅读 · 0 评论 -
新浪微博模拟登录分析(含验证码)
实验室项目结题需要爬取新浪微博的内容做实验,师兄提供了一份已实现的微博爬虫系统。本身可以轻松愉快的完成语聊收集这一部分,然而自己的微博账号始终登录失败。究其原因,结果是登录时需要验证码。而系统对于需要验证码登录的账号只能GG了,谷歌“新浪微博爬虫”相关内容后,发现多数文章(主要参考了豆瓣,百度空间,博客园)都是重复讨论模拟登录的过程。网上的文章并没有提到解决需要验证码登录的问题,或许是因为api没转载 2014-10-30 21:56:34 · 11953 阅读 · 6 评论 -
vi和vim编辑器
vi(vim)是上Linux非常常用的编辑器,很多Linux发行版都默认安装了vi(vim)。vi(vim)命令繁多但是如果使用灵活之后将会大大提高效率。vi是“visual interface”的缩写,vim是vi IMproved(增强版的vi)。在一般的系统管理维护中vi就够用,如果想使用代码加亮的话可以使用vim。下面是vi的使用教程:包含vi的基本介绍、使用模式、文件的打开关闭保存、插入转载 2014-10-16 22:25:19 · 606 阅读 · 0 评论 -
科研项目之经验之谈
preface:在走着走着的道路上,总会有些想法或者总结的念头,便想要记录下来,以备不时之需。ps:卤主搞自然语言处理相关,仅这块有些想法。一、学好理论基础卤主等有想法再些。二、从数据入手,分析数据,看准需要实现的目标无论科研还是工作,大同小异:做东西。在掌握基本方法(SVM, HMM, CRF, RF, LR等分类,聚类,回归工具)与工具(语言工具python,分原创 2015-06-02 16:16:13 · 1695 阅读 · 0 评论 -
Synergy安装及使用方法
preface: 先前是需要在两部电脑之间互传文件,现在是需要直接从windows复制东西到ubuntu中,网上搜了下神器synergy可破。卤主硬件条件为:一个ubuntu系统的32为电脑和windows8系统的64位电脑。软件条件:synergy软件,在两个系统上都要装,而且需要是同一个版本。软件安装:卤主在ubuntu下直接sudo apt-get install syn原创 2015-07-01 11:14:57 · 19108 阅读 · 2 评论 -
搁置之事
preface: 上午师姐去百度面试,算法问题。。。我们这搞NLP的,问算法问题?说是任何部门都会问这些简单的算法问题。回来后在leetcode以及《剑指offer》里找到了原题,算法,痛。以及其他的一些需要完成的任务,这段时间比较忙碌,先记录下来。1.There are two sorted arrays nums1 andnums2 of size m and n respective原创 2015-07-13 15:39:21 · 878 阅读 · 0 评论 -
算法编程——罗塞塔代码RosettaCode-你的代码烹饪书(code cookbook)
奥莱里公司有一个很不错的书籍系列,是以xxx cookbook为名,比如Ruby cookbook、rails cookbook、python cookbook、c# cookbook等等。这些书当然不是让你用Ruby或者Python煮菜,而是对特定比较典型不是很复杂的任务能够快速上手的代码示例。但是不是每个语言都有类似的出版物,比如F#或者Lua这类语言,不太可能有它们的cookbook转载 2015-11-02 11:42:22 · 2645 阅读 · 0 评论 -
开源网络爬虫Larbin的安装及配置
大概用了两天的时间用来安装和配置Larbin。总体来说,关于使用和配置larbin的资料还是有很多的,但在安装和配置过程中,我还是遇到了点问题。不过,终于,问题被解决了,larbin能帮我爬东西了!先说下自己遇到的问题吧:1. configure时提示没有makedepend程序。因为自己使用的是centos,所用使用yum install 来安装makedepend程序。安装过程转载 2014-09-27 09:04:46 · 1212 阅读 · 0 评论 -
Texmaker使用方法、Latex的优缺点
首先跟大家谈一谈什么是Latex。以下两段段文字直接引自或修改自Leibniz(http://hi.baidu.com/leibniz_gone/blog/item/be320b2460b8c233c89559c4.html)“Latex是什么,说它是一个“排版软件”。Latex不仅可以写论文,还可以处理日常生活中的各种文档工作。如写信,写书,画表格,甚至做幻灯片等等。它是转载 2014-09-13 15:53:36 · 7468 阅读 · 0 评论 -
火影忍者插曲(不是主题曲或者片尾曲)
火影忍者 疾风传OST2 参考目录: (NARUTO-ナルト- 疾风伝 オリジナル・サウンドトラック) 1. 升竜 2. 临界 (鸣人VS歌方--初次对战时候) 3. 撃破 4. 彩霞 (自来也初遇弥彦、长门、小南时候) 5. 预言者 6. 飞段 7. 角都 8. 红炎 (迪达拉 C4迦楼罗 ) 9. 乱髪 10. 埋葬转载 2014-04-20 13:20:28 · 2923 阅读 · 0 评论 -
cmd命令大全/cmd命令提示符大全
刚接触电脑的时候是从DOS系统开始,DOS时代根本就没有Windows这样的视窗操作界面,只有一个黑漆漆的窗口,让你输入命令。所以学DOS系统操作,cmd命令提示符是不可或缺的。可以告诉大家,大多数的程序员牛人或计算机专家在DOS系统下的操作是非常了得的,所以菜鸟要想成为计算机高手,DOS命令是非学不可。 直到今天的Windows系统,还是离不开DOS命令的操作。学习DOS系统操作,首先了解原创 2014-03-13 22:35:23 · 1693 阅读 · 0 评论 -
Eclipse快捷键大全(转载)
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对转载 2014-04-30 11:11:07 · 742 阅读 · 0 评论 -
信息检索:搜索引擎---怎样量化评价搜索引擎的结果质量
前言搜索质量评估是搜索技术研究的基础性工作,也是核心工作之一。评价(Metrics)在搜索技术研发中扮演着重要角色,以至于任何一种新方法与他们的评价方式是融为一体的。搜索引擎结果的好坏与否,体现在业界所称的在相关性(Relevance)上。相关性的定义包括狭义和广义两方面,狭义的解释是:检索结果和用户查询的相关程度。而从广义的层面,相关性可以理解为为用户查询的综合满意度。直观的来看转载 2014-10-26 14:41:51 · 3747 阅读 · 0 评论 -
Dos命令---目录命令
(一)md——建立子目录1.功能:创建新的子目录2.类型:内部命令3.格式:md[盘符:][路径名]〈子目录名〉4.使用说明:(1)“盘符”:指定要建立子目录的磁盘驱动器字母,若省略,则为当前驱动器;(2)“路径名”:要建立的子目录的上级目录名,若缺省则建在当前目录下。例:(1)在c盘的根目录下创建名为fox的子目录;(2)在fox子目录下再创建user子目录。md转载 2014-05-07 21:15:44 · 1093 阅读 · 0 评论 -
word应用2(实用)
1、快速改变Word文档的行距选中你需要设置行距的文本段落,按“Ctrl+ 1”的组合键,即可将段落设置成单倍行距;按“Ctrl+ 2”的组合键,即可将段落设置成双倍行距;按“Ctrl+5”的组合键,即可将段落设置成1.5倍行距。2、去除页眉的横线在页眉插入信息的时候经常会在下面出现一条横线,如果不想在页眉留下任何信息也无法自动去除此横线。这时可以采用下述的方法去掉:1.确认插入点转载 2014-05-21 22:04:36 · 4457 阅读 · 0 评论 -
硕士毕业设计积累
Record---------------------------------20140925---------------------------------原创 2014-09-25 18:12:25 · 1155 阅读 · 0 评论 -
XML DTD
简介 文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。 DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。 内部的 DOCTYPE 声明 假如 DTD 被包含在您的 XML 源文件中,它应当通过下面的语法包装在一个 DOCTYPE 声明中: ***********************************转载 2014-05-05 08:44:38 · 625 阅读 · 0 评论 -
notepad++ xml---如何使用Notepad++格式化XML文件
经常会从数据库中读到挤在一起的XML, 整理它们的格式需要使用一些工具. 比如笔者之前使用过online的tool. 后来经同事介绍, 改用VS2008的Ctrl+K, Ctrl+F来整理. 但是VS2008有点庞大, 开启起来还是有点慢, 用起来也远不如Notepad++顺手. 于是笔者Google了一把. 找到了下面的步骤, 非常好用, 在这里共享出来. 1. 把挤在一起的XM转载 2014-05-05 15:44:51 · 2766 阅读 · 0 评论 -
WIN7局域网文件共享设置方法
WIN7系统局域网文件共享设置方法!图文解答!工具/原料 两台电脑以上的局域网、WIN7操作系统 步骤/方法 1右击桌面网络----属性----更改高级共享设置 (注释:查看当前网络 比如:家庭网络、公共网络 等!) "我这里为公共网络"步骤阅读2选择 公共网络---选择以下选项:启动网络发现-----转载 2014-05-14 08:25:13 · 1105 阅读 · 0 评论 -
XML定义属性ID、IDREF、IDREFS详解(2012
属性类型:ID 含义:特定文档中唯一的名称 属性类型:IDREF 含义:对某些具有ID属性的元素的引用,这些元素的ID属性值必须与IDREF属性的值相同 属性类型:IDREFS 含义:若干以空格分隔的IDREF 属性类型:ENTITY 含义:已定义的外部实体的名称 属性类型:ENTITIES 含义:若干以空格分隔的ENTITY名称转载 2014-05-05 10:28:11 · 6144 阅读 · 0 评论 -
xml结点的遍历
dom4j通过ElementIterator对xml节点进行遍历xml文件:a19mathenglish这里先获取student节点。Element stu;然后获取这个节点的子节点course的iterator对象Iterator it=stu.elementIterator("course");while(itr.hasNext())转载 2014-06-17 09:10:08 · 750 阅读 · 1 评论 -
正则表达式生成器
对正则表达式很头疼,是不是?每次看到都觉得像看天书似的,别说让人自己整一个出来了。下面这个网站可以帮你生成正则表达式,而且还可以根据不同的语言生成不同的代码示例,很强大。 http://www.txt2re.com/index.php3 打开上面那个网页,你会看到有三步。 第一步,输出你想匹配的一个文本示例,然后点“Show Machted”,于是进入第二点。 第二转载 2014-10-24 14:41:31 · 5284 阅读 · 1 评论