爬虫
文章平均质量分 87
Nancy_LW
还是一个祖国的花朵啦啦啦
展开
-
web前端基础
HTML HTML HTML是一种标签,而不是一种编程语言。原创 2018-05-25 11:46:46 · 363 阅读 · 0 评论 -
网络编程
简介 socket &socketserver TCP编程 简介 网络编程就是实现计算机与计算机、计算机与服务器之间的连接。例如你在访问某个网站的时候,你的计算机就与该网站的服务器连接起来了,同时,该服务器也将网页以数据的形式传回给计算机。 socket &socketserver 关于socket模块,官方文档(socket)是这么描述的: Th...原创 2018-05-22 17:35:12 · 208 阅读 · 0 评论 -
数据存储(一)
本文是基于:《Python爬虫开发与项目实战》 一书的学习笔记。并对书中的代码进行了一定的修改。 JSON CSV 多媒体文件抽取 JSON CSV 将爬取的数据储存到CSV类型的文件中,利用到了csv 这个库,具体代码如下: import requests from bs4 import BeautifulSoup import csv url = "htt...转载 2018-06-06 09:50:19 · 328 阅读 · 0 评论 -
Requests
安装 请求与响应 安装 打开开始>搜索内输入cmd,然后输入以下代码: pip install requests 回车安装即可 接着输入 python 然后再输入 import requests 如果没有报错则安装成功 请求与响应...原创 2018-05-30 23:36:51 · 260 阅读 · 0 评论 -
正则表达式
基本语法与使用 Python下的正则 正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。本篇博客是基于:《Python爬虫开发与项目实战》一书的学习笔记。 基本语法与使用 如果想要匹配一个单词he,则使用“he”就可以匹配成功,同时因为正则忽略了大小写,所以“He”,“HE”和“hE”都会被匹配出来。然而,“here”、“header”等以“he”开头的词也会匹...原创 2018-05-31 18:46:00 · 374 阅读 · 0 评论 -
BeautifulSoup
安装 使用 BeautifulSoup 是用来对网页进行数据查找和提取的一个库。 更多使用方法可以参考文档:Beautiful Soup 4.2.0 文档 安装 Python3安装BeautifulSoup和Python2不同,打开cmd,输入pip install bs4 即可。 使用 导入BeautifulSoup包应该用这样的语句: from bs4 ...转载 2018-06-01 16:47:16 · 412 阅读 · 0 评论