自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)

原创 python中matplotlib模块的使用

matplotlib是python底层的绘图工具我们通过案例来详解是如何使用matplotlib模块的。1.折线图:一天中每隔两个小时气温变化的折线图绘制from matplotlib import pyplot as plt from matplotlib import font_manager# 图表的x轴的数据, 为12个小时(必须是一个可迭代的数据类型)x_times = ...

2019-02-27 09:32:14 821

python使用百度开源的绘图工具echart

1.单个条形图from pyecharts import Bar# 1.数据信息movieName = ["战狼2","速度","功夫瑜伽","西游伏妖篇","变形金刚5","摔跤吧"]movieMoney = [56.01, 26.94, 17.53, 16.49, 15.45

2019-02-26 09:06:35 429

原创 python之numpy模块

什么是numpy?快速, 方便的科学计算基础库(主要时数值的计算, 多维数组的运算)导入:import numpy as npnumpy创建数组?一维数组方法1:np.array()print(np.array([1,2,3,4,5]))# [1 2 3 4 5]print(np.array(range(1,6)))# [1 2 3 4 5]方法2:np.arange()...

2019-02-25 23:29:26 41

原创 使用scrapy爬虫框架爬取慕课网全部课程信息

爬取的链接: http://www.imooc.com/course/list爬取的内容: 课程链接, 课程的图片url, 课程的名称, 学习人数, 课程描述1.安装scrapy模块pip install scrapy2.新建项目scrapy startproject mySpider(项目名)cd mySpidertree # 可以看到文件中的树状图├── mySpider│...

2019-02-23 16:51:01 490 1

原创 scrapy爬虫框架

scrapy架构的优势:用户只需要定制开发几个模块, 就可以轻松实现爬虫, 用来抓取网页内容和图片, 非常方便;Scrapy使用了Twisted异步网络框架来处理网络通讯, 加快网页下载速度, 不需要自己实现异步框架和多线程等, 并且包含了各种中间件接口, 灵活完成各种需求scrapy架构的架构图:Scrapy主要包括了以下组件:• 引擎(Scrapy):用来处理整个系统的数据...

2019-02-20 15:52:01 81

原创 python词云分析之jieba,wordcloud模块

一.英文导入wordcloud模块from wordcloud import wordcloudimport re# 处理背景图片所需要的模块from PIL import Imageimport numpy as np1.切割和处理英文字符data = [] #用来保存切割后的字符with open('/tmp/passwd') as f: for line in f: ...

2019-02-20 15:39:36 245

原创 python解析页面之xpath

xpath:全称:XML PATH Language, 一种小型的查询语言;支持的解析:XML格式html格式通过元素,和属性进行导航xpath的常用规则html = """<!DOCTYPE html><html><head lang="en"> <title>xpath测试</title&gt

2019-02-20 14:42:16 133

原创 requests,BS4 爬取2016-2019中国大学排名并存储为csv格式文件

最好大学网url:http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.htmlhttp://www.zuihaodaxue.com/zuihaodaxuepaiming2017.htmlhttp://www.zuihaodaxue.com/zuihaodaxuepaiming2018.htmlhttp://www.zuihaodaxue.co...

2019-02-20 14:10:32 978 1

原创 python的csv格式存储

csv格式存储: csv文件格式是一种通用的电子表格和数据库导入导出格式。写入:import csvwith open('doc/example.csv', 'w') as f: writer = csv.writer(f) # 将列表的每条数据依次写入csv文件, 并以逗号分隔 writer.writerows([['1', '2', '3'], ['4', '5...

2019-02-20 13:53:17 221

原创 python页面分析之bs4模块

一.bs4简介Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beauti...

2019-02-20 13:49:34 136

空空如也

空空如也

空空如也
提示
确定要删除当前文章?
取消 删除