AI|Search
堆烟
【Semantic Web;中文;语义网;知识;Knowledge;楚辞;狼;徒步行走】。毕业于成都理工大学+复旦MSE。祖籍河北,家在天津,现住杭州。
展开
-
利用知网数据计算词语相似度
如何利用知网的数据进行词语的相似度计算,可以参考www.keenage.com上的相关文档。我就是参考的刘群和李素建的论文,并对公式进行了一定改进。如图:http://dl2.csdn.net/down4/20070712/12135942644.JPG原创 2007-07-12 14:00:00 · 1445 阅读 · 1 评论 -
格式化数据#3:有关逻辑推理/语义的资源
作者搜集的有关逻辑推理/语义的资源原创 2016-01-15 21:02:04 · 610 阅读 · 0 评论 -
格式化数据#4:有关机器学习的SDK/Lib/API
作者搜集的有关机器学习的库/API原创 2016-01-27 23:24:38 · 2663 阅读 · 2 评论 -
格式化数据#6:有关VR(虚拟现实)的资源
包括作者、Twitter、博客、会议、活动、播客等。整理自一篇微信公众的文章。原创 2016-02-10 21:56:35 · 1217 阅读 · 0 评论 -
Random Thoughts #13 @2013:由玩具到攒机(DIY PC)
由儿童玩具ATOMS联想到攒机(DIY PC)。原创 2013-11-27 17:58:31 · 1168 阅读 · 3 评论 -
Random Thoughts #7 爱与永生
标题由来1、WoW中联盟阵营有个经典任务:爱与家庭。相关故事;相关视频。2、爱 = AI = Artificial Intelligence。 3、《奇点临近》描述了将人脑上传到网络,这算是意识/思想的永生。思想的永生 古时候,可以通过著书立作,记录下一个人的思想。到了近现代,各种存储介质不断涌现:光盘、U盘、硬盘、SSD硬盘…… 不管怎么原创 2012-07-11 17:21:20 · 2410 阅读 · 1 评论 -
Random Thoughts #5 进化的遐想
PS:不是学硬件/机器人/控制等学科的,有些想法可能太天真了,勿喷~触发事件0:在杭州租的房子里,有好些蜈蚣……它们可以从墙边顺着墙壁爬,最后能在房顶上爬呀爬的,稳得很 –_-||触发事件1:CCTV科技频道的【我爱发明】节目,有一期是关于越野车的。当时就想,怎么不参考蜈蚣弄个“千足车”呢?那样多稳当,爬啥坡都没问题。触发事件2:现在已经有机器鱼了,在水里游来游去的,不会碰到其它鱼和池原创 2011-10-30 22:15:15 · 407 阅读 · 0 评论 -
对QQ和搜狗拼音的期望 - 2010.6
之所以对QQ和搜狗拼音有了这些期望,主要还是因为很烦QQ弹出的足球、篮球之类的新闻,只对于不爱球类运动的人而言,是个多么大的煎熬啊。 俺更希望QQ能够推荐这些种类的新闻,对不同用户进行个性化推荐,即使频率高点也可以接受啊:地区的(已有,但频率低),天文,IT,最新电影(单纯电影信息,而不是娱乐版块)等等。原创 2010-07-05 22:09:00 · 613 阅读 · 0 评论 -
WolframAlpha--菱形六十面体与Mathematics(WolframAlpha.com)
InfoQ的《Wolfram|Alpha,菱形六十面体背后的细节》http://www.infoq.com/cn/news/2009/05/Wolfram-Alpha Wolfram|Alpha尝试用符号计算使世界上的系统知识变得可计算。它的输入不是一组方程,而是语言。该系统的主要部分包括一个数据整理(data curation)管道,一个算法计算系统、一个语言学处理系统,还有一个自动原创 2009-05-26 14:23:00 · 1103 阅读 · 0 评论 -
个人信息管理系统
刚刚在论坛浏览帖子(http://topic.csdn.net/u/20080324/16/b2950947-d61d-412e-9475-096737fe0fa7.html?seed=189801062),回完后,打算记录下来这些想法,个人信息管理系统应该拥有的特性:1、随时(自动)保存 2、能与网上的服务器上的已保存内容进行同步--当然,由用户设定是否允许其他用户看到 3、能与PDA、手机、M原创 2008-05-02 14:58:00 · 2798 阅读 · 0 评论 -
搜狗拼音细胞词库的特殊用法--语料库,中文NLP
搜狗的输入法,它推出了细胞词库--都是网友整理的,每个词库都是一个小小的领域,我就下了魔兽世界的。http://pinyin.sogou.com/dict/做毕业设计时,我的语料库就需要这些词汇,当初很愁没人帮忙,现在好了,嘿嘿~~Sogou的爱好者殊不知自己也在为中文NLP做贡献。虽然没有词频是个缺陷。。。。。不管怎么说,做语料库,词库有着落了。感谢搜狗!感谢支持搜狗拼音的Fans!原创 2007-11-17 18:25:00 · 2497 阅读 · 0 评论 -
搜索中的智能--人性化与垂直搜索
----摘自我的毕业设计 人性化即在用户搜索某事物时,列出一些相关信息,这也可以称为发散性搜索,比如:搜索行车路线或查询车票,其相关事物可能是旅馆、风景区或特色小吃;搜索音乐,其相关事物可能是都喜欢该歌手或乐团的团体、组织。再举一个生活中的例子,查询今天多少号,其相关事物肯能是日期的农历表示→近两天的天气情况→历史上的今天(搜狗做得很好)→日程安排、计划。在人性化方面,垂原创 2007-06-11 13:11:00 · 818 阅读 · 0 评论 -
词库的构建
北大贡献了10万条左右的词库;知网(http://www.keenage.com)1、词性 参考北大的词性标注 b 区别词 取汉字“别”的声母。 c 连词 取英语连词conjunction的第1个字母。 e 叹词 取英语叹词exclamation的第1个字母。 f原创 2007-06-10 19:54:00 · 2180 阅读 · 2 评论 -
象形文字--中文自然语言理解的突破
中文自然语言理解一直是自然语言理解领域的难点和有意思的课题。之所以难,很大原因是因为中文由象形文字演化而来。但是,目前的中文NLP理论中,似乎不多见关于如何利用象形这一重要元素的。 我(个人)相信,这是中文NLP的突破口。正如我相信,涌现理论对AI很重要一样。 眼下我在学习DirectX和图形学方面的东西,对于NLP暂时只做头脑风暴吧。原创 2007-08-09 20:37:00 · 1868 阅读 · 2 评论 -
SNS(社会网络服务)的意义
SNS(Social Networking Service, 社会网络服务),通过提问、回答、评价等机制从用户处获取更准确的信息,比如爱问的知识人,百度的知道,Yahoo的知识堂等。SNS的意义:1) 弥补搜索结果尚不令人非常满意的遗憾。2) 抓住用户爱慕虚荣或喜欢助人为乐的心理,通过头衔等虚拟荣誉吸引聚集一部分用户群体。3) 为以后发展成为网络社区做准备,先免费,再某盈利。E.g. 腾讯原创 2007-07-12 13:57:00 · 873 阅读 · 0 评论 -
语料库或知识库
数据保存在SQL Server 2005中。在我看来,语料库和知识库的界限是模糊的,所以如果我的文章提到了语料库而没有用知识库(或反过来),请不要较真。 语料库/知识库的组成:北京大学共享的10万余条词汇;知网数据;2007年3月到5月底的450余篇新闻;语义分类体系;对象规则;对象实例。 语义分类体系:以973语义分类体系为基础,进行了扩充。体系是以原创 2007-07-12 14:05:00 · 1600 阅读 · 1 评论 -
格式化数据#8: AIE实验室交流群推荐的相关书籍(附豆瓣链接和ISBN)
整理自AIE实验室交流群推荐的相关书籍,包括了豆瓣链接和ISBN,不再仅仅是标题。更新至序号21。原创 2016-02-27 11:11:28 · 773 阅读 · 0 评论