python爬虫
难得 yx
这个作者很懒,什么都没留下…
展开
-
(五)numpy库和jieba库的学习
https://baijiahao.baidu.com/s?id=1637501213256152848&wfr=spider&for=pc原创 2020-07-23 10:28:44 · 327 阅读 · 0 评论 -
Echarts简单学习笔记
文章目录简介简单使用简介Echarts是一个商业级数据图表,它是一个纯JavaScript的图标库,兼容绝大部分的浏览器,底层依赖轻量级的canvas类库ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。创新的拖拽重计算、数据视图、值域漫游等特性大大增强了用户体验,赋予了用户对数据进行挖掘、整合的能力。官网地址:https://echarts.apache.org/zh/index.html简单使用在testEcharts.htm文件中:<!DOCTYPE htm原创 2020-07-22 16:50:28 · 283 阅读 · 0 评论 -
数据可视化之Flask框架的学习
文章目录数据可视化简介Flask框架简介练习render_template模块数据可视化简介数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。Flask框架简介Flask是一个使用 Python 编写的轻量级 Web 应用框架。其 WSGI原创 2020-07-21 16:32:39 · 2904 阅读 · 4 评论 -
(四)xlwt模块学习
文章目录xlwt模块简介xlwt模块简介xlwt 是 Python 用来在 Excel 写入数据和格式化数据的工具包,是用来生成兼容 Excel 97/2000/XP/2003, OpenOffice.org Calc 和 Gnumeric 的表格库。 xlwt 完全支持 Unicode。xlwt 不需要任何的 Excel 或者 COM 服务器就能在任意的平台生成 Excel 表格。用xlwt模块编写一个九九乘法表import xlwt# 将爬取到的数据存储在excel表中# 1.以utf-原创 2020-07-20 19:50:21 · 329 阅读 · 0 评论 -
python爬虫实战之爬取豆瓣电影top250并保存至excel或者sqlite中
文章目录项目思路代码结果展示项目思路获取数据——解析内容——保存数据代码from bs4 import BeautifulSoup #网页解析,获取数据import re #正则表达式,进行文字匹配import urllib.request,urllib.error #指定URL,获取网页数据import xlwt #进行excel操作import sqlite3 #进行SQLite数据库操作def main(): baseurl="https://movie.doub原创 2020-07-20 11:16:17 · 4389 阅读 · 1 评论 -
(三)re模块学习
文章目录正则表达式学习re模块的学习正则表达式学习re模块的学习re模块常用函数compile(pattern, flags=0)Compile a regular expression pattern, returning a pattern object.通过help可知:编译一个正则表达式模式,返回一个模式对象。从compile()函数的定义中,可以看出返回的是一个匹配对象,它单独使用就没有任何意义,需要和findall(), search(), match()搭配使用。测试:原创 2020-07-17 10:37:09 · 391 阅读 · 0 评论 -
(二)bs4模块学习
文章目录简介1.BeatifulSoup取出标签及其里面的内容只取出标签里面的内容(字符串)拿到标签里的属性值(以字典的形式保存)取出文件自身(Beautifulsop表示整个文档)输出的内容不包含注释符号应用文档 的遍历文档的搜索find_all字符串过滤,会查找与字符串完全匹配的内容正则表达式搜索(使用search()方法来匹配传入一个函数(方法),根据函数的要求来搜索kwargs参数text参数应用正则表达式来查找包含特定文本的内容limit参数css选择器简介Beautiful Soup是一个可原创 2020-07-16 23:03:29 · 796 阅读 · 0 评论 -
(一)urllib模块学习
这里写自定义目录标题urllib简介urllib简介好文链接 https://www.jianshu.com/p/63dad93d7000urllib 是一个收集了多个涉及 URL 的模块的包:urllib.request 打开和读取 URLurllib.error 包含 urllib.request 抛出的异常urllib.parse 用于解析 URLurllib.robotparser 用于解析 robots.txt 文件我们首先了解一下 Urllib 库,它是 Python 内原创 2020-07-16 16:54:46 · 1088 阅读 · 0 评论