关闭

[置顶] 向量空间模型

词项权重计算词项频率(term frequency)在布尔检索模型中,只考虑了词项在文档中出现与否,给定一个布尔查询,一篇文档要么满足查询要求要么不满足,返回的文档没有排序。对于Web搜索引擎,用户往往需要浏览非常多的网页才能找到需要的信息。如何才能对检索的文档进行评分和排序呢,一个合理的想法是,如果一篇文档包含的查询词的数目越多,那么这篇文档与查询相关的可能性就越高,就意味着更可能是用户所需要的文...
阅读(47) 评论(0)

[置顶] 布尔检索模型

最近在看《Introduction to Information Retrieval》(中文版为《信息检索导论》,下文简称为“IR”),是最经典的信息检索书籍之一了。由于淞姐要求我细读这本书然后跟同事分享,就有了这个版块,之后会陆续添加后续章节内容。即使是站在巨人的肩膀上了(从网络上搜集了不少内容),但很多细节往往还是需要自己用心体会。从一个读者到一个讲解人,在第一次做分享的时候已经感觉很不容易了,...
阅读(103) 评论(0)

Windows IDEA搭建Spark开发环境

1. 系统环境 Windows 10 jdk1.8 scala2.11.8 Intellij IDEA 2017.1.4 winutil.exe (下载地址:https://github.com/steveloughran/winutils) spark-2.2.0-bin-hadoop2.7.tgz 注:scala版本需要与spark版本兼容,否则编译报错NoSuchMethodError。官网下...
阅读(69) 评论(0)

Python将list形式的字符串转换为list

Python将list形式的字符串转换为list用python从redis中拿到了一个字符串数据,这个字符串内容形式如下:["1838", "13735", "8285", "35386"]上述字符串变量记为mstr,我实际上需要的是一个真正意义上的list,那么如何把mlist从# 先创建原始字符串方便测试 mstr = "[\"1838\", \"13735\", \"8285\", \"353...
阅读(52) 评论(0)

统计自然语言处理概率论和信息论基本概念及其推导过程

统计自然语言处理——预备知识2.1 概率论基本概念2.1.1 概率概率的三个公理 (1) 非负性: P(A)≥0P(A)\geq0 (2) 规范性: P(Ω)=1P(\Omega)=1 (3) 可列可加性: 事件A1,A2,...,Ai,...A_1,A_2,...,A_i,...互不相容(Ai∩Aj=∅A_i \cap A_j=\varnothing),则有 P(⋃i=0∞Ai)=∑i...
阅读(84) 评论(0)

Windows安装TensorFlow

一、安装Python3.5需要注意安装的Python版本,尝试Python3.6安装TensorFlow时报错了,查阅TensorFlow官网,推荐使用的Python3.5,估计是TF还不支持Python3.6以上版本。换成Python3.5马上就装成功了,使用官方Demo也测试通过。二、安装TensorFlowC:\Users\fego (master) λ python --version Py...
阅读(337) 评论(0)

Ubuntu安装JDK并设置环境变量

使用的jdk版本是:jdk-8u112-linux-x64.tar.gz新建/usr/lib/jvm文件夹用于存放jdk:sudo mkdir /usr/lib/jvm进入jdk-8u112-linux-x64.tar.gz文件所在目录,把jdk压缩包解压到/usr/lib/jvm目录下:sudo tar -C /usr/lib/jvm -xzf jdk-8u112-linux-x64.tar.gz...
阅读(324) 评论(0)

Android Studio阅读Android源码

先成功编译Android源码 源码根目录下执行命令mmm development/tools/idegen/ 源码根目录下执行命令development/tools/idegen/idegen.sh 上面三个步骤成功之后,会在源码根目录下生成2个文件,分别是android.iml和android.ipr (其实在根目录下还生成了一个.classpath隐藏文件),这就是Android Studio...
阅读(175) 评论(0)

SystemUI启动流程

SystemUI的根视图是在PhoneStatusBar的makeStatusBarView()方法中加载的。 PhoneStatusBar的addNavigationBar()是添加导航菜单的函数,把函数体注释掉就可以让导航栏消失。 addIcon(),updateIcon(),removeIcon()用于添加、更新、移除状态栏上面的应用小图标。animateStatusBarHide()和a...
阅读(271) 评论(0)

清华镜像源下载Android源码

felix@ubuntu:~$ mkdir ~/binfelix@ubuntu:~$ PATH=~/bin:$PATHfelix@ubuntu:~$ git clone https://aosp.tuna.tsinghua.edu.cn/android/git-repo.git/felix@ubuntu:~$ cp git-repo/repo ~/bin/建立一个名为android_source的工...
阅读(1254) 评论(0)

Git常用命令

在当前目录新建一个Git代码库 $ git init 查看当前git状态信息 $ git status 显示当前分支的版本历史 $ git log 显示暂存区与工作区的差异 $ git diff 下载url指向的Git项目和它的整个代码历史 $ git clone [url] 设置用户信息(设置用户名为felix,邮箱为felix@example.com) $ git config [--globa...
阅读(107) 评论(0)

Linux常用命令

chmod命令:chmod a+x ~/bin/repo解释: ~表示当前用户的根目录,~/bin/repo表示当前用户根目录bin/文件夹下的repo文件。chmod 是一个改变文件权限的命令。上述命令为所有用户添加x(可执行)权限。下面详细解释chmod命令的参数意义: u 代表: 用户 g 代表: 组 o 代表: 其他 a 代表: 全部 中间的...
阅读(128) 评论(0)

Ubuntu安装openjdk并设置环境变量

先安装openjdk: sudo apt-get install openjdk-7-jre sudo apt-get install openjdk-7-jdk安装完成后,用gedit文本编辑器在/etc/profile中添加环境变量: sudo gedit /etc/profile在打开的/etc/profile文件末尾添加下面几行: export JAVA_HOME=/usr/lib/...
阅读(4034) 评论(0)

Ubuntu命令行模式和图形界面模式切换

Ubuntu命令行模式和图形界面模式切换...
阅读(180) 评论(0)
    个人资料
    • 访问:8508次
    • 积分:223
    • 等级:
    • 排名:千里之外
    • 原创:14篇
    • 转载:0篇
    • 译文:0篇
    • 评论:0条