Python
图书馆的恶魔
这个作者很懒,什么都没留下…
展开
-
Python网络爬虫(五):爬虫原理总结
爬虫的工作原理:简单地说,就是爬虫程序模拟浏览器访问web服务器,从而获得自己感兴趣的内容的过程。这里需要了解一下网站的工作原理。1.基本结构Web采用的是客户机--服务器架构。客户端(Client)可以通过网络连接访问另一台计算机的资源或服务,而提供资源或服务的计算机就叫服务器(Server)。比如你通过电脑上的搜狗浏览器访问一个网站www.baidu原创 2017-10-26 19:28:41 · 534 阅读 · 0 评论 -
Python网络爬虫(三):图片下载器
动态网站 爬虫 图片下载原创 2017-10-25 12:38:14 · 852 阅读 · 0 评论 -
Python网络爬虫(二):小说下载器
# novel_downloader.py'''从《笔趣看》网站下载小说:1.定义一个下载类2.调用类'''class downloader: def __init__(self): self.server = 'http://www.biqukan.原创 2017-10-24 20:23:50 · 1091 阅读 · 0 评论 -
Python网络爬虫(八):Scrapy框架的使用
1.什么是Scrapy? Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的原创 2017-10-31 20:51:11 · 580 阅读 · 0 评论 -
wxPython学习(一)
把wxPython安装了,安装过程真是糟心。wxPython官网上的安装包是.whl文件,我不知道怎么装,就网上搜了一下,但大多数都是都是py2.x版本的,其对应的wxPython包是.exe格式,直接安装就行。我就又搜了下py3.x版本的wxPython如何安装,总算给我找到了方法。http://jingyan.baidu.com/article/fd8044fa2901f65031原创 2017-10-13 20:14:16 · 422 阅读 · 0 评论 -
Python实战1——address_book.py
# 地址簿程序原创 2017-10-13 18:29:38 · 663 阅读 · 0 评论 -
《简明Python 教程》学习笔记
《简明Python 教程》学习笔记原创 2017-10-09 19:36:41 · 966 阅读 · 0 评论 -
Python网络爬虫(一):初步了解
实际的软件开发=调用各种现成的库Python可以干嘛?1.网络应用,如网站、后台服务等——web2.小工具,脚本——爬虫3.实现对其他语言程序的包装和连接,胶水语言Python的不足:作为一种解释性语言,1.运行起来比C慢;2.代码无法加密,只能发布源代码,无法像C一样发布.exe。爬虫:1.基本原理是什么通过url获得网页的ht原创 2017-10-23 20:21:11 · 371 阅读 · 0 评论 -
Python网络爬虫(七):百度文库文章爬取器
在用前面的方法爬取百度文库的文章时,发现只能爬取已显示出来的几页文章,而对于没有显示的页数则无法获得其内容。如果要完整的看到整篇文章,需要手动地点击底下的“继续阅读”,使所有的页数都显示出来。原创 2017-10-29 17:44:13 · 5698 阅读 · 6 评论 -
Python网络爬虫(六):网页语言HTML
1.什么是HTML?HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写,它规定了自己的语法规则,用来表示比“文本”更丰富的意义,比如图片,表格,链接等。浏览器(IE,FireFox等)软件知道HTML语言的语法,可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。在Chrome浏览器中右键->检查,可以看到网页的html原创 2017-10-27 10:59:58 · 589 阅读 · 0 评论 -
Sublime Text 3 的安装和使用
之前学Python都是用的自带的IDLE,这几天心血来潮,突然想装个Sublime Text玩玩,毕竟Python IDLE没有语法高亮和自动填充功能,敲得太累了,而且也不好找错误。原创 2017-11-04 19:13:02 · 3350 阅读 · 0 评论