PYTHON
文章平均质量分 85
boksic
这个作者很懒,什么都没留下…
展开
-
用python批量下载网站内容
逛到一个网站http://www.meiguoliyu.com/发现里边的内容挺不错的,但是一页就那么一点内容,总共几百页,一页一页点过去浏览也太累了用PYTHON写了个程序把这几百页的内容都整合到一个文件里去,只用了十几行代码,python果然够简洁的。import urllib,urllib2,reurl = "http://www.meiguoliyu.com/html/meigu原创 2011-10-28 10:37:47 · 17278 阅读 · 0 评论 -
基于python的中文词频分析
受http://yixuan.cos.name/cn/2011/03/text-mining-of-song-poems/这篇文章的启发,觉得PYTHON来做文字处理分析应该不错,可以来做个词频分析,分析聊天记录可以看出每个人的说话习惯用的是暴力方法 不用语义分析 直接列出所有出现的字词 做下来觉得难点就在中文编码这部分 python下中文涉及的编码转化确实要琢磨一番首先数据文件要原创 2012-01-28 12:27:13 · 33152 阅读 · 1 评论