- 博客(82)
- 资源 (39)
- 收藏
- 关注
转载 Redis简介
Rdis和JQuery一样是纯粹为应用而产生的,这里记录的是在CentOS 5.7上学习入门文章:1.Redis简介 Redis是一个key-value存储系统。和Memcached类似,但是解决了断电后数据完全丢失的情况,而且她支持更多无化的value类型,除了和string外,还支持lists(链表)、sets(集合)和zsets(有序集合)几种数据类型。这些数据类型都支持push
2013-04-27 00:15:20 595
原创 Gibbs Sampling实现LDA
关于LDA的介绍见前面几篇文章,这里是Gibbs抽样解LDA的实现可以看到收敛之后主题的结果基本不变package org.jazywoo.lda;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;public cla
2013-04-25 21:08:38 1977 1
转载 向量空间模型
在有了tf-idf权重计算之后,一个自然的数学建模的想法是:tf-idf权重矩阵 向量空间模型把文档看成是一个向量(vector),其中的每个分量都对应词典中的一个词项,分量值为采用tf-idf计算出的权重值。当某词项在文档中没有出现时,其对应的分量值为0。于是,我们有一个|V|维实值空间,空间的每一维都对应词项(V为词项数目)。对于Web搜索引擎,
2013-04-24 13:12:36 3610
转载 概率语言模型及其变形系列(5)-LDA Gibbs Sampling 的JAVA实现
本系列博文介绍常见概率语言模型及其变形模型,主要总结PLSA、LDA及LDA的变形模型及参数Inference方法。初步计划内容如下第一篇:PLSA及EM算法第二篇:LDA及Gibbs Samping第三篇:LDA变形模型-Twitter LDA,TimeUserLDA,ATM,Labeled-LDA,MaxEnt-LDA等第四篇:基于变形LDA
2013-04-24 13:08:38 1231
转载 概率语言模型及其变形系列(2)-LDA及Gibbs Sampling
本系列博文介绍常见概率语言模型及其变形模型,主要总结PLSA、LDA及LDA的变形模型及参数Inference方法。初步计划内容如下第一篇:PLSA及EM算法第二篇:LDA及Gibbs Samping第三篇:LDA变形模型-Twitter LDA,TimeUserLDA,ATM,Labeled-LDA,MaxEnt-LDA等第四篇:基于变形LDA的paper分类
2013-04-24 13:06:50 1123
转载 概率语言模型及其变形系列(1)-PLSA及EM算法
本系列博文介绍常见概率语言模型及其变形模型,主要总结PLSA、LDA及LDA的变形模型及参数Inference方法。初步计划内容如下第一篇:PLSA及EM算法第二篇:LDA及Gibbs Samping第三篇:LDA变形模型-Twitter LDA,TimeUserLDA,ATM,Labeled-LDA,MaxEnt-LDA等第四篇:基于变形LDA的paper分类
2013-04-24 13:05:54 1593
转载 主题模型
两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。关键词:主题
2013-04-24 12:35:23 883
转载 先验概率 后验概率 似然 极大似然估计 极大后验估计 共轭 概念
最近在看LDA,里面涉及到狄利克雷的概念,为了把这个事情搞明白,查了一些相关概率知识,举个例子,掷硬币,伯努利实验 中随机变量x={正面,背面},正面的概率μ为模型参数,假定做了N次试验,Data 中观察序列为X={正面,正面。。。。反面},正面的次数为k,服从二项分布:p(X|μ)∼pk∗(1−P)(N−k)P(X|μ) 则成为似然函数。针对观察到的随机变量(也就是D
2013-04-23 23:45:08 963
转载 Dirichlet分布
基础知识:conjugate priors共轭先验 共轭先验是指这样一种概率密度:它使得后验概率的密度函数与先验概率的密度函数具有相同的函数形式。它极大地简化了贝叶斯分析。 如何解释这句话。由于P(u|D) = p(D|u)p(u)/p(D),其中D是给定的一个样本集合,因此对其来说p(D)是一个确定的值,可以理解为一个常数。P(u|D)是后验概率,p(D|
2013-04-23 23:27:51 1571
转载 Gibbs 采样
1,Gibbs抽样:对P(z),z是向量,按照Gibbs描述的步骤,可以抽取z(1),z(2),...z(n)这n个样本,Gibbs保证这n个样本的分布服从P(z)。 z(0)=(z1,z2,...,zn)Repeatfor i = 1 to n 从p(zi|z1,z2,...,zi,zi+1,...,zn)中抽取zi得到z(t)=(z1,z2
2013-04-23 18:40:32 1785
转载 EM算法
很碰巧,时隔一年了。面对经典的EM算法,我有了新的认识。经常有人谈到它就是"鸡生蛋,蛋生鸡"的解法,这个很通俗,但是只了解到这一层,是远不够的……EM算法的全名是Expectation Maximization,中文名叫期望最大化算法。它是一个在含有隐变量的模型中常用的算法,在最大似然估计(MLE)和最大后验估计(MAP)中常用。在GMM、HMM、PCFG、IBM 5个对齐模型以及K-Me
2013-04-23 18:37:56 751
转载 国内语料库建设一览表
英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万) 广外、上海交大大学英语学习者口语语料库 COLSEC (5万) 上海交大香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学中国英语专业语料库 CEME (148万) 南京大学中国英语学习者口语语料库 SECCL (100万) 南京大学国际外语学习者英语口语语料库中国部分
2013-04-23 18:07:12 1648
转载 java通过Socket执行HTTP的POST方法
package net.java2000.net;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.InputStreamReader;import java.io.OutputStreamWriter;import java.net.InetAddress;import
2013-04-23 10:28:51 1166
原创 java中判断字符编码的格式以及转码
java中判断字符编码以及转码 [参考]判断字符编码以及转码的一个工具类 public class TranCharset { private static final String PRE_FIX_UTF = "&#x"; private static final String POS_FIX_UTF = ";";
2013-04-23 10:19:23 1313
转载 LDA 主题模型(latent dirichlet allocation) 介绍
LDA作用 传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的。 举个例子,有两个句子分别如下: “乔布斯离我们而去了。” “苹果价格会不会降?”
2013-04-22 23:38:15 2430 1
转载 ICTCLAS2011_JNI学习笔记-ICTCLAS_FileProcess接口
boolean ICTCLAS_FileProcess(byte[] sSrcFilename, int eCodeType, int bPOSTagged, byte[]sDestFilename)接口:该接口与ICTCLAS_ParagraphProcess接口类似,只是该接口用与处理文件,对整个文件的内容进行分词并标注,最后将结果存在目标文件中 * Method: ICTCL
2013-04-18 11:37:26 885
转载 ICTCLAS2011_JNI学习笔记-ICTCLAS_ImportUserDictFile及ICTCLAS_SaveTheUsrDic接口
1、int ICTCLAS_ImportUserDictFile(byte[] sPath, int eCodeType)接口: * Method: ICTCLAS_ImportUserDictFile * Parameter: byte[] sPath * Parameter: int eCodeType * Returns:
2013-04-18 11:37:06 1020
转载 ICTCLAS2011_JNI学习笔记-ICTCLAS_SetPOSmap及ICTCLAS_ParagraphProcess接口
1、int ICTCLAS_SetPOSmap(int nPOSmap) * Method: ICTCLAS_SetPOSmap * Parameter: int nPOSmap ICT_POS_MAP_SECOND 0 //计算所二级标注集 ICT_POS_MAP_FIRST 1 //计算所一
2013-04-18 11:36:47 1315
转载 ICTCLAS2011_JNI接口-整体介绍
中科院的分词工具ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)2011版,汉语词法分析系统ICTCLAS主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典;支持繁体中文;支持gb2312、GBK、UTF8等多种编码格式。 ICTCLAS分词速度单机500KB/s,分词精度98
2013-04-18 11:32:59 780
原创 中科院分词ICTCLAS汉语分词系统简单配置
汉语分词一直来说都是进行文本分析的瓶颈,这里介绍一个汉语分词系统ICTCLAS,全球很受欢迎的汉语分词开源系统,曾获得首界国际分词大赛综合排名第一,国家973评测第一名;支持词典,多级词性标注,支持人名、地名、组织名,分词速500KB/s左右,分词精度98.45%,API不超过100KB,各种词典数据压缩后不到3M。一个非常优秀的分词系统,具体下载地址:http://ictclas.org/
2013-04-18 11:11:59 2292
原创 android ImageButton
在android中有一个ImageButton的View,跟Button按钮的区别是可以在Imagebutton上加载一个图片。从ImageButton这个字面意思上来看,它是一个图片按钮,那么我们就可以使用它做一个我们想要的图片按钮了,但是我们在实际使用的过程当中,就会发现该按钮的使用并没有想像中的那么简单,需要再增加一些代码或再配置XML才能实现图片按钮按下的效果,个人感觉有点麻烦,不
2013-04-15 23:45:07 842
原创 android设置背景平铺
1.Android背景平铺android中达到类似于windows桌面背景的平铺的效果,定义一个bitmap对象,在xml中和代码中均可,设置其tileMode为repeat。在drawable文件夹下建立如下文件tilebg.xml:Java代码 version ="1.0" encoding ="utf-8" ?> xmlns:android =
2013-04-15 22:47:49 1020
转载 android外接存储设备状态判断-USB和SD卡连接状态
项目中要得到USB的连接状态,在3.1以前的版本中,有一个ACTION_UMS_CONNECTED广播,表示手机已进入大容量模式,但是没有消息说USB有没有连上 。3.1以上的版本包含了一个android.hardware.usb ,也没有相应的API。其实我们可以从batterymanager入手:IntentFilter mIntentFilter = new IntentFilter()
2013-04-15 21:20:19 4442
原创 android 打开GPS的2种方式
打开GPS,有两种方式。代码如下:进入GPS设置界面,再手动打开Intent myIntent = new Intent(Settings.ACTION_SECURITY_SETTINGS ); startActivity(myIntent);复制代码直接打开GPSIntent gpsIntent =
2013-04-15 20:59:51 2702 1
转载 android 自定义Dialog背景透明及显示位置设置
先贴一下显示效果图,仅作参考: 代码如下: 1、自定义Dialog public class SelectDialog extends AlertDialog{public SelectDialog(Context context, int theme) { super(context, theme);
2013-04-15 19:41:13 832
原创 Android——WebView组件的使用详解
通过本专题的讲解可以了解到WebView组件的详细使用:网络内容1、LoadUrl直接显示网页内容(单独显示网络图片)2、LoadData显示中文网页内容(含空格的处理)APK包内文件1、LoadUrl显示APK中Html和图片文件2、LoadData(loadDataWithBaseURL)显示APK中图片和文字混合的Html内容res/layout/main.x
2013-04-15 10:24:39 1053
转载 android Intent和PendingIntent的区别
intent英文意思是意图,pending表示即将发生或来临的事情。 PendingIntent这个类用于处理即将发生的事情。比如在通知Notification中用于跳转页面,但不是马上跳转。 Intent 是及时启动,intent 随所在的activity 消失而消失。 PendingIntent 可以看作是对intent的包装,通常通过getActivity,getBroadc
2013-04-15 09:38:29 575
原创 Android Application 创建全局变量
以前都是建立一个ConstData的类来保存全局用的变量,但是有时候确实是有点小问题。所以研究了一下使用Application来建立全局变量,下面就是代码,主要分为四个文件:(1)是MyApplication类,保存全局变量以及变量的查询和修改(2)TestAndroid 类 也是主类(3)otherActivity 另外一个类调用全局变量试试是不是被主类改变了(4)manif
2013-04-14 23:33:02 789
原创 Android中Spinner下拉列表(使用ArrayAdapter和自定义Adapter实现)
今天学习了Spinner组件,使用Spinner相当于从下拉列表中选择项目,下面演示一下Spinner的使用(分别使用ArrayAdapter和自定义Adapter实现)(一):使用ArrayAdapter进行适配数据: ①:首先定义一个布局文件: <LinearLayout xmlns:android="http://schemas.android.com/apk/re
2013-04-14 23:04:00 964
转载 Android中定时器的3种实现方法
在Android开发中,定时器一般有以下3种实现方法:一、采用Handler与线程的sleep(long)方法二、采用Handler的postDelayed(Runnable, long)方法三、采用Handler与timer及TimerTask结合的方法下面逐一介绍:一、采用Handle与线程的sleep(long)方法Handler主要用来处理接受到的消
2013-04-14 19:56:32 523
原创 android 解决GestureDetector.SimpleOnGestureListener中对某些view,点击之后总是触发longPress事件
在使用SimpleOnGestureListener,来添加手势时,突然间发现有的view可以成功,有的却总是触发longPress事件、不触发其他的listViewView view=findViewById(R.id.listView1); view.setOnTouchListener(new OnTouchListener() { @Override public
2013-04-11 11:33:14 1500
原创 Android 拍照后显示照片
package cn.testcamera; import java.io.File; import java.text.SimpleDateFormat; import java.util.Date; import android.app.Activity; import android.content.Intent; import android.graphics.Bi
2013-04-11 10:23:06 849
原创 android view的width或者height变化的动画
public static void expand(final View v) { v.measure(LayoutParams.FILL_PARENT, LayoutParams.WRAP_CONTENT); final int targtetHeight = v.getMeasuredHeight(); v.getLayoutParams().height = 0;
2013-04-09 22:03:20 2054
转载 Android View绘制流程
框架分析在之前的下拉刷新中,小结过触屏消息先到WindowManagerService(Wms)然后顺次传递给ViewRoot(派生自Handler),经decor view到Activity再传递给指定的View,这次整理View的绘制流程,通过源码可知,这个过程应该没有涉及到IPC(或者我没有发现),需要绘制时在UI线程中通过ViewRoot发送一个异步请求消息,然后ViewRoot自
2013-04-09 21:40:05 557
原创 android textview 中超出屏幕宽度的字符 省略号显示
当利用textview显示内容时,显示内容过多可能会折行或显示不全,那样效果很不好。今天发现android api中已经给出自动省略的功能。实现如下: android:layout_height="wrap_content" android:id="@+id/hello"
2013-04-09 21:12:48 1032
原创 android 关于setWidth()和setHeight()没反应的问题
在android开发过程中,对于控件的高度,宽度,虽然在xml中用android:layout_height="match_parent"设置了高度(match_parent和fill_parent是一样的,2.2版本后就用match_parent代替fill_parent了。)但有时,程序需要,必须在代码里,动态设置控制的高度或宽度。我想当然的用setHeight(100);设置了高度,
2013-04-09 21:12:15 6244 2
转载 Android 获取屏幕高度、标题高度、状态栏高度详解
1.获取状态栏高度: decorView是window中的最顶层view,可以从window中获取到decorView,然后decorView有个getWindowVisibleDisplayFrame方法可以获取到程序显示的区域,包括标题栏,但不包括状态栏。 于是,我们就可以算出状态栏的高度了。 Java代码 Rect frame = new
2013-04-09 11:17:58 880
原创 android 正在运行的activity和services
你是不是很想知道当前状态下,系统在后台正运行着的activity呢?这里,让我们一起来实现吧。[java] view plaincopy/** * 获取系统中正在运行的任务信息(强调下,任务是多个activity的集合) */ public void run(){ String in
2013-04-08 10:38:04 1286
转载 android -保存和恢复activity的状态数据
一般来说, 调用onPause()和onStop()方法后的activity实例仍然存在于内存中, activity的所有信息和状态数据不会消失, 当activity重新回到前台之后, 所有的改变都会得到保留. 但是当系统内存不足时, 调用onPause()和onStop()方法后的activity可能会被系统摧毁, 此时内存中就不会存有该activity的实例对象了. 如果之后这个act
2013-04-08 10:33:10 709
转载 WindowManager.LayoutParams详解
WindowManager.LayoutParams 是 WindowManager 接口的嵌套类;继承于 ViewGroup.LayoutParams 。 它的内容十分丰富。其实WindowManager.java的主要内容就是由这个类定义构成。下面来分析一下这个类: 定义public static class WindowManager.LayoutPara
2013-04-07 23:01:30 640
ssd3 practical quiz 10
2011-05-07
ssd3 practical quiz 8
2011-05-07
ssd3 practical quiz 7
2011-05-07
ssd3 practical quiz 6
2011-05-07
ssd3 practical quiz 5
2011-05-07
ssd3 practical quiz 3
2011-05-07
ssd3 practical quiz 2
2011-05-07
ssd3 practical quiz 1
2011-05-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人