- 博客(4)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 Python练习册 第 0006 题:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
笔者最近初接触Python语言,在做一些简单的刷题练习。第 0006 题:你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。题目如上,鉴于目前网上的答案难找且质量参差不齐,在本文中,笔者尝试着从一个Python新手
2016-08-21 17:17:01 4461
原创 Python代码调试问题:IOError: cannot identify image file
IOError: cannot identify image file这个Error不是什么大问题,我却在这个bug上浪费了不少时间,希望可以帮助大家节省调试的时间。原代码如下:# -*- coding: utf-8 -*-'''第 0005 题:你有一个目录,装了很多照片,把它们的尺寸变成都不大于 iPhone5 分辨率的大小'''import osi
2016-08-20 23:59:28 17816 8
原创 Python爬虫实战二:下载百度贴吧帖子内的壁纸
本文是笔者爬虫实战系列做个第二个项目。做这个项目的初衷是因为之前在网上有看到有个教程,利用正则表达式匹配来完成网页解析图片的步骤。而笔者下午刚刚学习了BeautifulSoup这个强大的库,便想看看能不能利用该库完成同样的目标。这样一来,可以使新手在不需要学习繁杂的正则表达式的前提下,完成爬取网页中图片的项目。希望本文能对新手学习写python爬虫有些帮助,也很欢迎大家前来指正代码中的
2016-08-20 00:03:35 624
原创 Python爬虫实战一:爬取糗事百科的文本段子
本文是笔者进行Python爬虫学习自己动手写的第一个完整的程序。实现了最基本的爬虫功能,即对糗事百科里文本段子的爬取,使用字典这一数据结构来存储段子的内容、作者以及点赞数(评论数不知何故,只能输出奇数序号,实现失败),再将其打印输出。程序主体是两大块:网页下载器、网页解析输出器初学Python,编程上一定存在着不少的问题,欢迎各路大神拍砖指正。因笔者是用sublime text3自带的调试器进行程序调试的,该软件调试时不支持交互,故所有常量都是直接赋值的,使用时可以根据实际需要自行修改。下面贴上代码
2016-08-19 20:22:36 1129
红黑树算法问题:当插入结点无叔叔结点时怎么办?
2016-11-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人