shelry_liu-CSDN博客

原创 scrapy使用

这篇入门教程将引导你完成如下任务：创建一个新的Scrapy项目定义提取的Item 写一个Spider用来爬行站点，并提取Items 写一个Item Pipeline用来存储提取出的Items新建工程在抓取之前，你需要新建一个Scrapy工程。进入一个你想用来保存代码的目录，然后执行：scrapy startproject 项目名这个命令会在当前目录下创建一个新目录tutorial，它的结

2016-12-14 20:22:50 257

原创安装scrapy

1.安装python2.7.9版本，该版本自带pip工具、以及安装可以勾选配置环境变量 2.安装zope.interface 地址：https://pypi.python.org/pypi/zope.interface/4.3.2 或：py -2 -m pip install zope.interface3.安装lxml 地址：https://pypi.python.org/pypi/lxm

2016-12-13 21:24:33 189

原创欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦： Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传 LaTex数学公式 UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2016-12-13 21:11:56 303

转载 scrapy

Scrapy介绍Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。所谓网络爬虫，就是一个在网上到处或定向抓取数据的程序，当然，这种说法不够专业，更专业的描述就是，抓取特定网站网页的HTML数据。抓取网页的一般方法是，定义一个入口页面，然后一般一个页面会有其他页面的URL，于是从当前页面获取到这些URL加入到爬虫的

2016-11-19 17:39:25 429

原创 CSS

CSS层叠样式表，作为表现层，让页面表现的更丰富，美化HTML页面。用于定义HTML页面中各元素的样式，例如：元素背景、高度、宽度、元素排列方式等。CSS创建当读到一个样式表时，浏览器会根据它来格式化 HTML 文档。插入样式表的方法有三种: 外部样式表当样式需要应用于很多页面时，外部样式表将是理想的选择。在使用外部样式表的情况下，你可以通过改变一个文件来改变整个站点的外观。每个页面使用 <l

2016-10-30 18:16:35 255

HTML:一种用来定义网页的文本，服务器返回html，浏览器读取html源码后，解析HTML，显示页面。HTML表示网页信息的符号标记的超文本标记语言。 HTML基本结构 <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>菜鸟教程(runoob.com)</title> </head> <body> <h1>我的第一个标题</h1

2016-10-30 12:00:44 264

原创欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来，用它写博客，将会带来全新的体验哦： Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传 LaTex数学公式 UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2016-10-30 10:22:27 383

shelry_liu的博客

原创 scrapy使用

原创安装scrapy

原创欢迎使用CSDN-markdown编辑器

转载 scrapy

原创 CSS

原创 HTML

原创欢迎使用CSDN-markdown编辑器

空空如也

空空如也