自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

天道酬勤

宝剑锋从磨砺出,梅花香自苦寒来

  • 博客(7)
  • 收藏
  • 关注

转载 Python nltk -- Sinica Treebank

原url:http://cpmarkchang.logdown.com/posts/184192-python-nltk-sinica-treebank以下为原文:今天我們來談談如何用python nltk做中文的的自然語言處理 nltk有內建的中文treebank,是中研院的sinica treebank 是免費的中文treebank 至於要如何使用呢? 首先 先載入模組>>> from

2015-08-18 20:13:44 2408

转载 TEXT CLASSIFICATION FOR SENTIMENT ANALYSIS – NAIVE BAYES CLASSIFIER

Sentiment analysis is becoming a popular area of research and social media analysis, especially around user reviews and tweets. It is a special case of text mining generally focused on identifying opin

2015-08-12 14:25:36 903

转载 中文分词与停用词的作用

转自:http://blog.sina.com.cn/s/blog_56d8ea9001018i6y.html首先什么是中文分词stop word?英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”

2015-08-10 14:55:12 13777

转载 #每日一面BAT#第1题:概率与集合元素个数

转自:http://ask.julyedu.com/question/581**每日一面#: 某Hash函数将任一字符串非均匀映射到正整数k,概率为2^(-k),即:P{Hash()=k}=2^(-k)。 现有字符串集合S,其元素经映射后,得到的最大整数为10。试估计S的元素个数。 提示:被映射得到的整数快速衰减,“最大整数为10”这一条件可近似考虑为“存在某整数为10”。**参考答案:

2015-08-07 19:06:33 584

转载 “机器学习MLDT”图书翻译稿

转自:http://ask.julyedu.com/article/294Machine Learning_Hands-On for Developers and Technical Professionals-Wiley(2014)【 译者按】承蒙机械工业出版社秦编辑的邀请,从今天起,开始“Machine Learning_Hands-On for Developers and Technica

2015-08-05 11:30:31 1050

原创 《父与子的编程之旅-与小卡特一起学python》第18章

第18章:一种新的输入-事件18.1事件 18.2键盘事件 18-01# -*- coding:utf-8 -*-#__author__ = 'Janvn'# 2015/08/04'''反弹球程序,加入动画精灵和Clock.tick()'''import pygame,syspygame.init()screen=pygame.display.set_mode([640,480])

2015-08-05 11:25:41 4696 1

转载 Python列表推导式---轻量级循环

转自:http://www.cnblogs.com/skyhacker/archive/2012/01/27/2330288.html 列表推导式(list comprehension)是利用其他列表创建新列表(类似于数学术语中的集合推导式)的一种方法。它的工作方式类似于for循环,也很简单:In [39]: [x*x for x in range(10)]Out[39]: [0, 1, 4,

2015-08-03 20:55:30 659

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除