简约设计の艺术

讨论软件制造过程中的艺术与工程,软件哲学

丁亮ID:DL88250
[修改头像]
1243589次访问,排名18(1)好友81人,关注者50
Linux、Java、C/C++,OpenSource热爱者,擅长JavaSE/JavaEE开发,熟悉JSF、Spring、JPA、OSGi等框架应用的架构,目前正在深入学习算法、OOAD、TDD以及敏捷实践。
DL88250的文章
原创 798 篇
翻译 7 篇
转载 150 篇
评论 482 篇
88250的公告


最近评论
DL88250:的确是有这个问题。但是我们测试的结果表明分类器的效果还是很好的。: )
magicblue:使用你的文章中的后验概率计算方法引入的文档长度问题很难解决。比如一个1000个词的文章和一个100个词的文章,1000词文章的最终概率要比100词文章小很多很多。最终所求的概率值完全被文档长度所决定,即便是相差一个词的两个文档的后验概率也会被多乘的一个概率项拉大很多。这种后验概率计算方法在实践中根本不可行,至少我没有找到解决的办法。
但是如果文档表示成固定长度的向量,此问题便可以使……
DL88250:To magicblue:
1. 用的中文分词组件
2. 确实是问题。当词很多的时候可以按照分词的数目做连乘。这是我们目前的解决方法。
magicblue:文本分类器我以前也做过,但是遇到一些难题。这里想请教一下:
1.不知道博主是怎么处理汉字的单词问题的?中文分类器需要汉字的词而不是字作为分类的基本元素,这么多词如何表示,我尝试看过输入法的编写,但是还是很模糊。
2.博主的核心公式似乎有一个问题,这也是我以前遇到过的。虽然这些公式比较简单,但是会引入新问题,即文档长度。较长的文档比较短的文档概率低很多很多,因为长文档的词多……
88250:: )
订阅我的博客
XML聚合  FeedSky
文章分类
收藏
    相册
    Beyond
    壁纸收集
    动漫Kiss图图
    我的珍藏
    我的桌面
    CSDN专家Blog
    孟岩的专栏
    袁萌的专栏
    Ubuntu/Linux相关
    ChinaUnix
    Compiz Themes
    Compiz-Fusion
    deviantART Search
    GetDeb
    Gnome-Look
    KDE-Look
    LinuxToy
    Linux桌面中文网
    Ubuntu中文官方论坛
    Ubuntu桌面中文网
    代码示例
    C++代码示例
    HTML代码示例
    Java Code examples
    技术站点
    Apache Software
    CSDN
    Eclipse.org
    Extreme Programming
    hibernate.org
    IBM软件技术
    JavaFX Script Reference
    JavaWorld@TW
    Java开源大全
    JBoss.org
    LEX & YACC Page
    NetBeans中文社区
    PHP 官方
    Ruby on Rails
    Ruby中文社区论坛
    SOURCEFORGE.NET
    Springframework.org
    Sun中国技术社区
    UML官方
    图书下载
    CSDN下载频道
    e 书时空
    IT e Book
    中华电脑书库
    中国 E 书网
    中国 IT 认证实验室
    中文电子书网
    偶要雷锋 - 分享社区
    我爱 e 书
    网络中国 - E 书
    我的偶像 :-)
    Alan Turing
    Bjarne Stroustrup's Homepage
    Don Knuth's Home Page
    Martin Fowler
    Richard Stallman's Home Page
    Uncle Bob (Robert C. Martin)
    我的朋友
    Eleven的专栏
    Eric.Gao的空间
    Meteor的专栏
    mmchsusan的主页
    solonote的专栏
    Vanessa的小窝
    ZhiBaoDeng的专栏
    zyofprogrammer的学习历程
    先知罗庄的专栏
    光光的Blog~
    师傅dorainm的Blog
    皮皮的空间
    秋歌的专栏
    阿明的专栏
    在CSDN的朋友
    老李的Blog
    存档

    原创 Ubuntu Feisty Fawn(7.04)中scim的问题解决

    新一篇: eclipse 快捷键

    在网页里输入不了中文,相当郁闷。。。。Eva里却可以 。。。。
    解决方法如下:
    安装过scim-bridge的话先删除:
    sudo apt-get autoremove
    scim-bridge
    然后
    sudo gedit /etc/X11/xinit/xinput.d/zh_CN
    把GTK和QT两项的输入法均改为"xim"
    这样做至少目前是没什么问题了,呵呵~

    发表于 @ 2007年04月13日 20:15:00|评论(loading...)|编辑

    旧一篇: 哈哈!可以免费定购Ubuntu 7.04的光盘啦!!!!

    评论:没有评论。

    发表评论  


    登录
    Csdn Blog version 3.1a
    Copyright © 88250