自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Matplotlib之扇形图绘制

1 扇形图介绍扇形图用整个圆表示总数,用圆内各个扇形的大小表示各部分数量占总数的百分数。2 扇形图绘制扇形图通过pie()函数绘制plt.pie(x, explode=None, labels=None)x 扇形数据explode 设置某几个分块是否要分离饼图labels 每块扇形标签autopct 百分比数据标签shadow 是否显示阴影plt.pie()有3个返回值patches 绘制饼图每一块的对

2020-08-27 12:24:10 4027

原创 Matplotlib之直方图绘制

1 直方图介绍直方图由一系列高度不等的纵向条纹或线段表示数据分布情况,一般用横轴表示数据范围,纵轴表示分布情况。特点: 绘制连续性的数据,展示一组或者多组数据的分布情况(统计)。2 直方图绘制直方图通过hist()函数绘制• plt.hist(x, bins=None) # 绘制以x为数值,bins为组数,组数 = 极差/组距示例:某地区连续50年中四月份平均气温数据如下:temp= [6.9,4.1,6.6,5.2,6.4,7.9,8.6,3.0,4.4,6.7,7.1,4.7,9.1

2020-08-27 10:24:11 462

原创 通用爬虫和聚焦爬虫的区别

根据使用场景网络爬虫可分为通用爬虫和聚焦爬虫两种。1 通用爬虫通用网络爬虫是捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。1.1 目标把互联网上所有的网页下载下来,放到本地服务器里形成备份,再对这些网页做相关处理(提取关键字、去掉广告),最后提供一个用户检索接口。通用爬虫工作流程:爬取网页–存储数据–内容处理–提供检索/排名服务1.2 第一步:抓取网页搜索引擎网络爬虫的基本抓取流程:a)首先选取

2020-08-26 23:00:31 5522

原创 Matplotlib之条形图绘制

1 条形图介绍条形图是用宽度相同的条形的高度或者长短来表示数据多少的图形。条形图可以横置或者纵置,纵置时也称为柱形图。特点: 能够使人一眼看出各个数据的大小,易于比较数据之间的差别。2 条形图绘制条形图通过bar()函数绘制• plt.bar(x, height) # 绘制以x为x轴位置,height为y轴位置的竖条形图示例一:假设获取到了2019年内地电影票房前20的电影(列表a)和电影票房数据(列表b),那么如何更加直观的展示该数据a = [“流浪地

2020-08-26 17:13:57 9655

原创 Matplotlib之散点图绘制

1 散点图介绍散点图用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。特点: 判断变量之间是否存在数量关联趋势,表示离群点(分布规律)2 散点图绘制散点图通过scatter()函数绘制• plt.scatter(x,y) # 以默认的形状颜色等绘制散点图示例一:假设通过爬虫你获取到了长沙2019年4,10月份每天白天的最高气温(分别位于列表a,b),那么此时如何寻找出气温和随时间变化的某种规律a = [1

2020-08-26 15:32:10 828

原创 Matplotlib之优化图片呈现(组件和中文显示问题)

图形组成实际上,图形的组成除了x,y轴。还有很多组件。如下图:组件详情:方法描述plt.figure(figsize=None,dpi=None)生成新的图片,figsize:图片大小,dpi:透明度plt.savefig(fname)保存图片plt.xticks(ticks=None)设置x轴刻度的值plt.yticks(ticks=None)设置y轴刻度的值plt.xlabel(xlabel)设置x轴标签plt.ylabel(ylabe

2020-08-25 18:21:42 174

原创 Matplotlib之折线图绘制

1 折线图介绍折线图以折线的上升或下降来表示统计数量的增减变化的统计图。特点: 能够显示数据的变化趋势,反映事物的变化情况2 折线图绘制折线图通过plot()函数进行绘制:• plt.plot(x, y) # 使用默认的线样式及颜色绘制x,y构建的图形实例:数据如下,绘制折线图形• x = [1,2,3,4]• y = [2,3,1,2]import matplotlib.pyplot as pltx = [1,2,3,4]y = [2,3,1,2]plt.plot(x

2020-08-25 11:41:15 327 2

原创 python爬虫相关简介

1 “大数据时代”,数据获取的方式企业生产的用户数据:大型互联网公司有海量用户,所以他们积累数据有天然的优势,有数据意识的中小型企业,也开始积累数据。数据管理资讯公司:通常这样的公司有很庞大的数据采集团队,一般会通过市场调研、问卷调查、固定的样本监测,和各行各业的公司进行合作、专家对话(数据积累很多年最后得出的科研结果)。政府/机构提供的公开数据:政府通过各地政府统计上报的数据进行合并,机构一般是权威的第三方网站。第三方数据平台购买数据:通过各个数据交易平台来购买各行各业需要的数据,根据获取的难度

2020-08-25 00:31:32 232

原创 Matplotlib绘制图形之初步介绍

Matplotlib是一个Python的绘图库,它可与 NumPy 一起使用,可以代替Matlab使用。其优点有:(1)将数据进行可视化,使数据更直观;(2) 使数据更加更具有说服力。由于Matplotlib是第三方库,所以需要安装它才可以使用。安装命令: pip install matplotlib安装可参考官网: https://matplotlib.org/users/installing.html注意:Matplotlib3.0要求python3版本才可安装使用。图片与子图的介绍Mat

2020-08-24 09:48:59 857

原创 Python操作MySQL相关步骤及代码

安装pymysql:• Python3:pip install pymysql• Python2:pip install mysqldbPython操作MySQL步骤:step 1:创建connection,用来连接数据库step 2:获取cursor,通过connection对象去获取游标(相当于指针)step 3:执行查询、执行命令、获取数据、处理数据step 4:关闭cursorstep 5:关闭connection语句:pymysql.connect(host=None, po

2020-08-24 00:06:26 126

原创 sql语句之操作数据

操作数据1 新增数据整行插入:INSERT INTO 数据表名 VALUES(值1,值2,值3...);指定列中插入数据:INSERT INTO 数据表名 (字段1,字段2,....) VALUES (值1,值2,值3...);指定列中插入多条数据:INSERT INTO 数据表名 (字段1,字段2,....) VALUES (值1,值2,值3...),(值1,值2,值3...)...;例如:在 Student表中添加name,gender两个字段的数据insert into Stu

2020-08-19 21:02:20 109

原创 sql语句之操作数据表

操作数据表查看当前数据库中所有表:SHOW TABLES;创建表:CREATE TABLE 数据表名 (字段1 类型 约束,字段2 类型 约束,.....)查看表的创建语句:SHOW CREATE TABLE 数据表名;查看表描述信息:DESC 数据表名;添加表字段:ALTER TABLE 数据表名 ADD 字段 类型;修改表字段:ALTER TABLE 数据表名 MODIFY 字段 类型; #不重命名ALTER TABLE 数

2020-08-19 17:44:42 123

原创 sql语句之操作数据库

操作数据库(DDL)创建数据库: `CREATE DATABASE 数据库名 [charset = utf8];#[]表示可选内容` 注意:charset指定编码为utf8查看创建数据库的命令:SHOW CREATE DATABASE 数据库名;查看已经创建的数据库:SHOW DATABASES;查看当前使用的数据库:SELECT DATABASE();使用数据库:USE 数据库名;删除数据库:DROP DATABASE 数据库名;注意:SQL语句不区分大小写每

2020-08-19 17:28:17 90

原创 数据库之SQL基本数据类型

SQL是结构化查询语言,是一种用来操作RDBMS(关系型数据库管理系统)的数据库语言,当前关系型数据库都支持使用SQL语言进行操作,也就是说可以通过SQL操作oracle,sql server,mysql等关系型数据库。SQL语句主要分为:• DQL:数据查询语言,用于对数据进行查询• DML:数据操作语言,对数据进行增加、修改、删除• DDL:数据定义语言,进行数据库、表的管理等数据完整性在表中为了更加准确的存储数据,保证数据的正确有效,可以在创建表的时候,为表添加一些强制性的验证,包括数据字

2020-08-19 16:24:27 1154

原创 数据库介绍及安装

通常,我们存储数据,直接用本地文件即可。但是,本地文件不利于存放海量数据,也不利于用程序对文件的数据进行查询与管理。那么为了解决这些弊端,才有数据库的出现,那么数据库也是每个程序员必须掌握的技术。数据库(database)简称DB,实际上就是一个文件集合,是一个存储数据的仓库,本质就是一个文件系统,数据库是按照特定的格式把数据存储起来,用户可以对存储的数据进行增删改查等操作。数据库存储数据特点:• 持久化存储• 读写速度极高• 保证数据的有效性• 对程序支持非常好,容易扩展数据库的分类:•

2020-08-19 15:02:47 233

原创 python数据分析师的初步认识之文件操作

文件操作介绍在实际操作中,通常采集本地数据来进行数据分析,那么就需要学习Python去对本地文档进行读取与写入等操作。比如:txt文件,json文件,csv文件,excel文件等。1-1 本地文件操作步骤• 打开文件• 操作文件• 关闭文件1-2 Python操作txt文件代码:open(file, mode=‘r’,encoding=None) --> 打开文件• file --> 文件路径• mode --&

2020-08-19 14:08:58 235

原创 python数据分析师的初步认识之Jupyter的使用

Jupyter介绍Jupyter Notebooks 是一款开源的网络应用,我们可以将其用于创建和共享代码与文档。 其提供了一个环境,你无需离开这个环境,就可以在其中编写你的代码、运行代码、查看输出、可视化数据并查看结果。因此,这是一款可执行端到端的数据科学工作流程的便捷工具,其中包括数据清理、统计建模、构建和训练机器学习模型、可视化数据等等。1-1 Jupyter Notebooks特点• 基于web的在线编辑器• 可交互式• .ipynb文件分享• 支持markdown1-2 Jupyt

2020-08-15 16:58:04 620

原创 python数据分析师的初步认识之数据分析的介绍

python数据分析师的初步认识之数据分析的介绍1-1 数据分析基本概念• 用适当的统计分析方法对收集来的大量数据进行分析• 提取有用信息和形成结论• 对数据加以详细研究和概括总结的过程1-2 数据分析基本概念数据分析的流程1-3 为什么要学习数据分析• 岗位有需求• 是机器学习的基础• 数据科学的基础1-4 数据分析工具注意:数据分析与数据挖掘的相似之处:数据挖掘和数据分析都是对数据进行分析、处理等操作,从而得到有价值的知识数据分析与数据挖掘的区别:在应用工具上,数据

2020-08-15 16:44:36 226

原创 计算机基础相关要点

1.计算机基本概念计算机俗称电脑,是现在一种用于高速计算的电子计算机器。它有以下几个特点:数值计算逻辑计算具有存储记忆功能总的来说,计算机是能够按照一定程序运行、自动、高速处理数据的现代化智能电子设备。而它的组成分为两块:硬件和软件。硬件:鼠标、键盘、显示器、CPU、硬盘等,一切我们能看得见又摸得着的设备软件:pycharm、qq、微信等,一切我们能看得见却摸不着的东西2....

2020-04-03 19:27:33 170

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除