
集体智慧编程
sherri_du
这个作者很懒,什么都没留下…
展开
-
ch5优化
优化算法:通过尝试许多不同题解并给这些题解打分一确定其质量的方式找到一个问题的最优解。 1、最简单的是随机优化——随机搜索 随机给定猜测,计算其中最佳题解并返回(有随机性,不一定返回最优解,同时没有利用已经发现的最优解,解题效率非常低) 2、爬山法:以一个随机解开始,在其临近的解集中寻找更好的题解,类似于从斜坡上向上走 缺陷:简单的从斜坡下不一定会产生全局最优解,最后的解会是一个局部范围内原创 2016-03-05 21:55:54 · 444 阅读 · 0 评论 -
ch6.正则表达式
Python爬虫入门(7):正则表达式 http://python.jobbole.com/81346/ Python爬虫入门(1):综述Python爬虫入门(2):爬虫基础了解Python爬虫入门(3):Urllib库的基本使用Python爬虫入门(4):Urllib库的高级用法Python爬虫入门(5):URLError异常处理Python爬虫入门(6):Cookie的使用转载 2016-03-06 21:59:46 · 652 阅读 · 0 评论 -
Python中文分词组件 jieba
jieba "结巴"中文分词:做最好的Python中文分词组件 "Jieba" Feature 支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。转载 2016-03-20 22:02:03 · 705 阅读 · 0 评论