自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (2)
  • 收藏
  • 关注

原创 人人都是产品经理 总结

1.首先什么是产品?在互联网领域,就是满足人们需求的载体,或解决某个问题的东西。2.产品经理的传统职责是规划产品的生命周期,负责产品的上市策略,定价策略,营销策略,销售与分销策略等。3.书中提到了UCDchina.com 这个网站,是一个以用户为中心的设计大社区,可以满足想做产品经理的人的一部分需求。另外书中提到了KPI(key performance indicators)关键业绩指标来

2012-08-31 21:03:32 788

原创 基于信息语义的异构信息集成方法 -董明哲,张同军

论文的核心是提出信息语义的概念,进而提出以其为核心的信息模型,用来解决异构信息系统集成。

2012-08-31 14:55:56 13458

原创 产品经理-必备

1.书籍:《人人都是产品经理》 《点石成金》 《这些道理没有人告诉过你》2.网站:ucdchina user centroid design 以用户需求为中心,是一个大型专业社区,知名互联网公司的产品团队和专家都在里面)、关注一些知名产品专家和团队的博客,推荐白鸦、苏杰;3.必须的技能培养:好的产品人员需要较强的沟通协调能力、数据分析能力和文案写作能力等等,这两类工作所涉及的基础工具应当掌

2012-08-31 10:08:44 1355

原创 面向金融领域的文本情感分析 笔记

金融文本的倾向性判定方法  文本情感分类感知器算法基于优化感知器的文本倾向性分析方法利用DocRank算法 优选出具有代表性的情感样本作为训练语料集合

2012-08-26 22:44:44 6129 1

原创 硕士常用工具包

网络数据获取 :web Crawler  heritrix(JAVA)网页数据净化工具: htmlparser  Jsoup  Jsoup是基于Java的开源程序,可以直接解析出网页中的URL地址和其中的文本

2012-08-26 21:25:15 703

原创 IT知识普及

命名实体识别:指识别文本中 具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。在当今世界,随着计算机的普及以及互联网的迅猛发展,大量的信息以电子文档的形式呈现在人 们面前。为了应对信息爆炸带来的严重挑战,人们迫切需要一些自动化的工具帮助他们在海量的信息源中迅速找到真正重要的信息。于是信息抽取技术应运而生。而 命名实体识别是信息抽取技术中的重要组成部分,同时它还能应用于自动问答、机

2012-08-26 20:59:18 780

原创 分本分类与聚类 笔记

1.去掉HTML网页中的tag标记:采用哈工大 《基于行块分布函数的通用网页正文抽取算法》的部分代码2.降维 特征抽取 通过计算文档频率(DF)降低特征维数,这是最简单的降低特征空间维数的方法。3.information Gain (IG)反映的是该term 为整个分类带来的信息量4.Mutual Information (MI)MI越大,term 和某一类C 共现的概率越

2012-08-26 20:22:58 1300

原创 IT界重要会议

TREC :文本检索会议中文信息学报 journal of chinese information processingACL会议(Annual Meeting of the Association for Computational Linguistics)是自然语言处理与计算语言学领域最高级别的学术会议,由计算语言学协会主办,每年一届。涉及对话(Dialogue)篇章(

2012-08-26 19:41:35 963

原创 STL常见容器set 、vector、 map 对比

为了实现集合的快速运算,set的实现采用了平衡二叉树,因此,set中的元素必须是可排序的。如果是自定义的类型,那在定义类型的同时必须给出运算符map内部的实现自建一颗红黑树(一种非严格意义上的平衡二叉树),这颗树具有对数据自动排序的功能。一. vector1.声明:          一个vector类似于一个动态的一维数组。          vector a; //声明一个

2012-08-25 21:10:05 1050

原创 vim 常用使用方法

1. 查找/xxx(?xxx)      表示在整篇文档中搜索匹配xxx的字符串, / 表示向下查找, ? 表示                  向上查找.其中xxx可以是正规表达式,关于正规式就不多说了.                  一般来说是区分大小写的, 要想不区分大小写, 那得先输入                  :set ignorecase

2012-08-25 20:38:31 971

原创 crontab 执行脚本***.sh 方法

编写linux脚本文件 如 ***.sh程式必须以下面的行开始(必须方在文档的第一行):#!/bin/sh符号#!用来告诉系统他后面的参数是用来执行该文档的程式。在这个例子中我们使用/bin/sh来执行程式。当编辑好脚本时,假如要执行该脚本,还必须使其可执行。要使脚本可执行:编译 chmod +x filename 这样才能用./filename 来运行2. 如果查询c

2012-08-25 10:09:47 9391

原创 g++ 编译使用方法

用g++编译单个源文件myprog.cc很简单,只要把文件名当参数传给g++就行了。    $ g++ myprog.cc    $ ls -l    -rwxr-xr-x 1 wvh users 13644 Oct 5 16:17 a.out    -rw-r--r-- 1 wvh users 220 Oct 5 16:17 myprog.cc    默认

2012-08-23 16:28:53 3154

转载 linux下mysql命令(授权用户 基本操作)

1.linux下启动mysql的命令:  mysqladmin start  /ect/init.d/mysql start (前面为mysql的安装路径)  2.linux下重启mysql的命令:  mysqladmin restart  /ect/init.d/mysql restart (前面为mysql的安装路径)  3.linux下关闭my

2012-08-10 14:25:56 8590

原创 phpMyadmin常见问题

ForbiddenYou don't have permission to access /phpmyadmin on this server.Apache/2.2.17 (Fedora) Server at 219.223.251.62 Port 80修改方法:vim /etc/httpd/conf.d/phpMyAdmin.conf

2012-08-09 20:10:12 2603

转载 Linux下mysql备份 恢复

在bin目录下执行。比如我们要备份mysql中已经存在的名为linux的数据库,要用到命令mysqldump 命令格式如下: [root@linuxsir01 root]# mysqldump -u root -p linux > /root/linux.sql Enter password:在这里输入数据库的密码 通过上面的命令,我们要明白两件事,首先备份数据库是要以

2012-08-09 13:59:07 711

转载 AI顶级会议列表 & ACL相关

The First Class:tier-1的conferences, 其实基本上就是AI里面大家比较公认的top conference. 下面同分的按字母序排列.IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI实在太大, 所以虽然每届基本上能录100多篇(现在已经到200多篇了),但分到每个领域就没几篇了,象machine lea

2012-08-08 09:15:10 2552

转载 单词转换(map对象)

http://my.oschina.net/ppppower/blog/36779

2012-08-07 22:20:11 498

中文停用词表

比较全面的中文停用词表,对于从事自然语言处理的研究者很有用处。

2012-11-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除