python 网络数据获取
ksy_e
时间太快,指缝太宽。 记录学习的点滴。
展开
-
python 爬虫数据清洗
最近学习python网络数据获取,看到了关于数据的清洗,觉得很好用,现贴出代码,权当记录。 # Python 数据清洗 #cleanInput() 功能: #输入input, #清除input中的'\n', 多余空格,文献标记[ ], 删除单个字符(除i/a 外),转化为utf-8编码格式以消除转义字符, #输出2-grams列表 ngrams from urllib.request原创 2016-12-13 19:22:52 · 11576 阅读 · 0 评论 -
笔试题
str = raw_input("input:") ''' 题目: 根据输入,如果是数字,取出 第1th的百分位数;如果是字母,取出出现频次第1的字母 输入: [1,2,3,4,5,6,6,6,6,7,8,9,80,9] [Tianjin,Nanjing,Nanjing,Hainan] ''' cnt_str = 0 cnt_dig = 0 print str原创 2017-09-21 23:36:26 · 429 阅读 · 0 评论 -
python爬虫——爬取微信文章
最近几天看了会儿《精通python网络爬虫》,觉得这本书写的比较好,不仅仅因为这本书中的代码都是用python3编写的。这本书条例很清晰,代码全面,里面讲解的很详细,提到了实战过程中会遇到的坑以及相应的解决办法,所以非常适合新手入门。另外,这本书语言上也比较平实,代码、图、文字描述等,使得读起来和实战是没有障碍的。 下面是按照书中的内容,写的一个微信文章的小爬虫,仅作为学习记录。另外,提醒读者不原创 2017-12-08 17:36:46 · 2871 阅读 · 1 评论