简约设计の艺术
讨论软件制造过程中的艺术与工程,软件哲学
DL88250
登录
注册
全站
当前博客
空间
博客
好友
相册
留言
丁亮
ID:DL88250
[修改头像]
共
1243589
次访问,排名
18(1)
好友
81
人,关注者
50
人
Linux、Java、C/C++,OpenSource热爱者,擅长JavaSE/JavaEE开发,熟悉JSF、Spring、JPA、OSGi等框架应用的架构,目前正在深入学习算法、OOAD、TDD以及敏捷实践。
DL88250的文章
原创 798 篇
翻译 7 篇
转载 150 篇
评论 482 篇
88250的公告
最近评论
DL88250:
的确是有这个问题。但是我们测试的结果表明分类器的效果还是很好的。: )
magicblue:
使用你的文章中的后验概率计算方法引入的文档长度问题很难解决。比如一个1000个词的文章和一个100个词的文章,1000词文章的最终概率要比100词文章小很多很多。最终所求的概率值完全被文档长度所决定,即便是相差一个词的两个文档的后验概率也会被多乘的一个概率项拉大很多。这种后验概率计算方法在实践中根本不可行,至少我没有找到解决的办法。
但是如果文档表示成固定长度的向量,此问题便可以使……
DL88250:
To magicblue:
1. 用的中文分词组件
2. 确实是问题。当词很多的时候可以按照分词的数目做连乘。这是我们目前的解决方法。
magicblue:
文本分类器我以前也做过,但是遇到一些难题。这里想请教一下:
1.不知道博主是怎么处理汉字的单词问题的?中文分类器需要汉字的词而不是字作为分类的基本元素,这么多词如何表示,我尝试看过输入法的编写,但是还是很模糊。
2.博主的核心公式似乎有一个问题,这也是我以前遇到过的。虽然这些公式比较简单,但是会引入新问题,即文档长度。较长的文档比较短的文档概率低很多很多,因为长文档的词多……
88250:
: )
订阅我的博客
文章分类
Adoration
(RSS)
Agile Sorftware Develeopment
(RSS)
Architecture/Framework Design
(RSS)
Automated Text Categorization
(RSS)
C#&&.NET
(RSS)
C/C++
(RSS)
Code Name:l0y0l
(RSS)
Compile Principles
(RSS)
Database
(RSS)
Data-Structrue/Algorithms
(RSS)
Design Patterns
(RSS)
Eclipse
(RSS)
English
(RSS)
Fiddlededee
(RSS)
Hibernate Framework
(RSS)
J2EE/JavaEE
(RSS)
J2SE/JavaSE
(RSS)
Java Persistence API
(RSS)
Java Server Faces
(RSS)
JavaFX
(RSS)
Life in Programming
(RSS)
Mathematics
(RSS)
MultiMediia
(RSS)
My Linux
(RSS)
NetBeans
(RSS)
Network Engineering
(RSS)
Open Source
(RSS)
OSGi
(RSS)
Regular Expression
(RSS)
Ruby&Rails
(RSS)
Seed Management
(RSS)
Shell Programming
(RSS)
Software Engineering
(RSS)
Software Testing
(RSS)
Spring Framework
(RSS)
StoneAgeDict
(RSS)
SWT/JFace/RCP
(RSS)
System Analyst exam
(RSS)
TeX/LaTeX
(RSS)
TTPlayer in Linux——LivaPlayer
(RSS)
UML Modeling
(RSS)
Web UI Design
(RSS)
Windows
(RSS)
にほんごのべんきょう
(RSS)
收藏
相册
Beyond
壁纸收集
动漫Kiss图图
我的珍藏
我的桌面
CSDN专家Blog
孟岩的专栏
袁萌的专栏
Ubuntu/Linux相关
ChinaUnix
Compiz Themes
Compiz-Fusion
deviantART Search
GetDeb
Gnome-Look
KDE-Look
LinuxToy
Linux桌面中文网
Ubuntu中文官方论坛
Ubuntu桌面中文网
代码示例
C++代码示例
HTML代码示例
Java Code examples
技术站点
Apache Software
CSDN
Eclipse.org
Extreme Programming
hibernate.org
IBM软件技术
JavaFX Script Reference
JavaWorld@TW
Java开源大全
JBoss.org
LEX & YACC Page
NetBeans中文社区
PHP 官方
Ruby on Rails
Ruby中文社区论坛
SOURCEFORGE.NET
Springframework.org
Sun中国技术社区
UML官方
图书下载
CSDN下载频道
e 书时空
IT e Book
中华电脑书库
中国 E 书网
中国 IT 认证实验室
中文电子书网
偶要雷锋 - 分享社区
我爱 e 书
网络中国 - E 书
我的偶像 :-)
Alan Turing
Bjarne Stroustrup's Homepage
Don Knuth's Home Page
Martin Fowler
Richard Stallman's Home Page
Uncle Bob (Robert C. Martin)
我的朋友
Eleven的专栏
Eric.Gao的空间
Meteor的专栏
mmchsusan的主页
solonote的专栏
Vanessa的小窝
ZhiBaoDeng的专栏
zyofprogrammer的学习历程
先知罗庄的专栏
光光的Blog~
师傅dorainm的Blog
皮皮的空间
秋歌的专栏
阿明的专栏
在CSDN的朋友
老李的Blog
存档
2008年05月(31)
2008年04月(23)
2008年03月(55)
2008年02月(78)
2008年01月(76)
2007年12月(13)
2007年11月(28)
2007年10月(33)
2007年09月(21)
2007年08月(68)
2007年07月(113)
2007年06月(65)
2007年05月(83)
2007年04月(44)
2007年03月(23)
2007年02月(74)
2007年01月(78)
2006年12月(49)
Ubuntu Feisty Fawn(7.04)中scim的问题解决
新一篇: eclipse 快捷键
在网页里输入不了中文,相当郁闷。。。。Eva里却可以 。。。。
解决方法如下:
安装过
scim-bridge的话先删除:
sudo apt-get autoremove
scim-bridge
然后
sudo gedit /etc/X11/xinit/xinput.d/zh_CN
把GTK和QT两项的输入法均改为"xim"
这样做至少目前是没什么问题了,呵呵~
发表于 @
2007年04月13日 20:15:00
|
评论(
loading...
)
|
编辑
旧一篇: 哈哈!可以免费定购Ubuntu 7.04的光盘啦!!!!
评论:没有评论。
发表评论
姓 名:
主 页:
校验码:
看不清,换一张
登录