代码实战
文章平均质量分 86
AI阅读和图谱
北京工业大学在读博士
北京交通大学本硕
展开
-
Python数据可视化 | 11、基于地理特征的美国农药使用分析
数据背景本案例数据取自著名的数据科学竞赛网站 Kaggle 上的美国农药使用数据集(Pesticide Use in Agriculture)。 这套数据集很有趣,它记录了2014和2015年度每个各州各县的 423 种农药的使用情况。此外,该数据汇总的农药使用情况有两种估测指标来描述,分别是低估测值(LOW_ESTIMATE)和高估测值(HIGH_ESTIMATE)。 以下是对这两个不同估测方法的官方解释:Two different methods were used to estimate a r原创 2021-08-26 15:24:18 · 749 阅读 · 2 评论 -
Python数据可视化 | 10、可交互式可视化
目录BokehPlotlyStreamlitBokehBoken: an interactive visualization library for modern web browsers基于Web浏览器呈现的交互式可视化多种语言支持Python, Scala, Julia,和R.Json作为BokehJS的输入HTML作为BokehJS的输出OFFICIAL:https://docs.bokeh.orghttps://github.com/bokeh/bokehTutori原创 2021-08-26 15:23:39 · 516 阅读 · 0 评论 -
Python数据可视化 | 8、如何选择合适的可视化方案(基于Seaborn)
目录分类散点图分类分布图箱图提琴图非对称提琴图 (split=True)分类统计估计图统计柱状图灰度柱状图分类子图小结观测点的直接展示:swarmplot, stripplot观测近似分布的展示:boxplot, violinplot均值和置信区间的展示:barplot, pointplot%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyp原创 2021-08-24 15:24:52 · 442 阅读 · 0 评论 -
Python数据可视化 | 6、基于Sesborn探索变量间的关系
目录绘制线性回归模型拟合不同模型残差图变量间的条件关系探索控制图片的大小和形状小结数据变量之间的关联性,主要针对定量数据而言;数据的分布问题也是主要针对定量数据;分组问题及组间问题里,就是在数据分析中,一定会包括定序和定类数据。比统计更直观呢~%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as pltimport seabo原创 2021-08-24 10:36:55 · 483 阅读 · 0 评论 -
Python数据可视化 | 5、Seaborn 基本操作
目录Seaborn 究竟是什么?Seaborn 风格管理风格参数设置尺度参数设置颜色管理分类调色板序列调色板分叉调色板小结Seaborn 究竟是什么?基于 matplotlib and Pandas,用更简单的调用呈现更多美图~ 鱼与熊掌兼得~If matplotlib “tries to make easy things easy and hard things possible”, seaborn tries to make a well-defined set of hard things e原创 2021-08-23 15:43:46 · 758 阅读 · 0 评论 -
Python数据可视化 |4、可视化案例练习题目(基于Matplotlib)
目录航班乘客变化分析鸢尾花花型尺寸分析餐厅小费情况分析泰坦尼克号海难幸存状况分析航班乘客变化分析%matplotlib inlineimport matplotlib as mplfrom matplotlib import pyplot as pltimport seaborn as snsimport pandas as pd# 设置一些全局的资源参数,可以进行个性化修改import matplotlib# 设置图片尺寸 14" x 7"# rc: resource configu原创 2021-08-23 13:01:32 · 5182 阅读 · 5 评论 -
Python数据可视化 |3、真实数据上的可视化分析(基于Matplotlib)
目录确认数据配置参数关联分析分布分析组间分析简单总结确认数据import pandas as pd # 读取数据到DataFrameimport urllib # 获取网络数据import tempfile # 创建临时文件系统import shutil # 文件操作import zipfile # 压缩解压temp_dir = tempfile.mkdtemp() # 建立临时目录data_source = 'http://archive.ics.uci.edu/ml/machine-原创 2021-08-22 23:21:58 · 507 阅读 · 0 评论 -
Python数据可视化 | 2、Matplotlib 的基本操作
目录常用设置常用图形常用样式小结常用设置获取当前图表对象fig = matplotlib.pyplot.gcf()(gcf = get current figure)常用图表对象设置例子:有两种设置图像大小的方式,但是有区别!fig.set_size_inches(10,10) # 以英尺为单位matplotlib.pyplot.figure(figsize=(14,7))保存当前图表对象matplotlib.pyplot.savefig(“figure1.png”)原创 2021-08-22 16:34:28 · 1102 阅读 · 0 评论 -
Python数据可视化 | 1、数据可视化流程
目录1、数据准备2、确定图表3、分析迭代4、输出结论5、小结6、作业1、数据准备数据规模:数据分组、数据采样(处理大数据时候尤为需要)数据类型:数值数据、分类数据(一定要对数据结构特别清楚:连续?离散?有序吗?)数据规模:取值异常、数据缺失数据分组 groupby# DataFarmedf = pd.DataFrame({'key1':['a','a','b','b','a'], 'key2':['one','two','one','two','on原创 2021-08-21 21:19:59 · 774 阅读 · 0 评论 -
一元线性回归利用最小二乘法求解原理代码及案例
目录1、线性回归的原理基础定义公式推导简单理解2、最小二乘法PYTHON实现0. 导入相关库1. 导入数据2. 定义损失函数3. 定义算法拟合函数4. 测试定义的函数5. 画出拟合曲线3、最小二乘简单例子1、线性回归的原理基础定义线性回归是利用数理统计中的回归分析,来确定两种或两种以上属性间相互依赖的定量关系的一种统计分析方法。举个例子,一套房子的具有面积、卧室数量、卫生间数量等三个属性,该房子的售价与上述三个属性息息相关,可以根据实际情况构造出各个属性之间的线性关系表达式,表达式就被成为线性回归方程原创 2020-07-08 16:39:13 · 3649 阅读 · 0 评论 -
数据结构与算法学习笔记(python)——第5节 二分搜索
前言本人是一个长期的数据分析爱好者,最近半年的时间的在网上学习了很多关于python、数据分析、数据挖掘以及项目管理相关的课程和知识,但是在学习的过程中,过于追求课程数量的增长,长时间关注于学习了多少多少门课程。事实上,学完一门课之后真正掌握的知识并不多,主要的原因是自己没有认真学习和理解温故而知新的这句话的真正含义。因此,从现在开始,我在学习《数据结构与算法——基于python》的课程内容之后...原创 2020-04-07 22:31:15 · 401 阅读 · 0 评论 -
数据结构与算法学习笔记(python)——第四节 搜索与排序
前言本人是一个长期的数据分析爱好者,最近半年的时间的在网上学习了很多关于python、数据分析、数据挖掘以及项目管理相关的课程和知识,但是在学习的过程中,过于追求课程数量的增长,长时间关注于学习了多少多少门课程。事实上,学完一门课之后真正掌握的知识并不多,主要的原因是自己没有认真学习和理解温故而知新的这句话的真正含义。因此,从现在开始,我在学习《数据结构与算法——基于python》的课程内容之后...原创 2020-03-27 22:46:34 · 261 阅读 · 3 评论 -
数据结构与算法学习笔记(python)——第三节 递归
前言本人是一个长期的数据分析爱好者,最近半年的时间的在网上学习了很多关于python、数据分析、数据挖掘以及项目管理相关的课程和知识,但是在学习的过程中,过于追求课程数量的增长,长时间关注于学习了多少多少门课程。事实上,学完一门课之后真正掌握的知识并不多,主要的原因是自己没有认真学习和理解温故而知新的这句话的真正含义。因此,从现在开始,我在学习《数据结构与算法——基于python》的课程内容之后...原创 2020-03-27 09:36:55 · 547 阅读 · 0 评论 -
数据结构与算法学习笔记(python)——第一节 数组应用程序实战
本人是一个长期的数据分析爱好者,最近半年的时间的在网上学习了很多关于python、数据分析、数据挖掘以及项目管理相关的课程和知识,但是在学习的过程中,过于追求课程数量的增长,长时间关注于学习了多少多少门课程。事实上,学完一门课之后真正掌握的知识并不多,主要的原因是自己没有认真学习和理解温故而知新的这句话的真正含义。因此,从现在开始,我在学习《数据结构与算法——基于python》的课程内容之后,抽出固定的时间对每天学习的内容进行总结和分享,一方面有助于个人更好的掌握课程的内容,另一方面能和大家一起分享学习过程原创 2020-03-13 22:34:33 · 418 阅读 · 0 评论