自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

转载 第一回:Matplotlib初相识

DataWhale《Fantastic-Matplotlib》课程学习笔记

2022-09-13 23:00:02 134 1

原创 Task04:Docker网络

学习资料:【狂神说Java】Docker最新超详细版教程通俗易懂DataWhale Docker开源教程文章目录9.Docker网络理解Docker0容器互联--link自定义网络网络连通9.Docker网络理解Docker0当Docker进程启动时,会在主机上创建一个名为docker0的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上,附加在其上的任何网卡之间都能自动转发数据包。从docker0子网中分配一个 IP 给容器使用,并设置 docker0 的 IP 地址为容器的

2021-10-03 16:31:43 108

原创 Task05:Docker-Compose

学习资料:【狂神说Java】Docker最新超详细版教程通俗易懂DataWhale Docker开源教程文章目录10.Docker Compose查看服务状态停止或删除服务查看服务输出日志10.Docker Compose用户通过一个单独的 docker-compose.yml模板文件(YAML 格式)来定义一组相关联的应用容器为一个项目(project)。安装docker compose:# 使用镜像加速下载$sudo curl -L "https://get.daoclou

2021-10-03 16:31:08 224

原创 Task03:Docker数据管理

学习资料:【狂神说Java】Docker最新超详细版教程通俗易懂DataWhale Docker开源教程文章目录容器数据卷容器数据卷挂载数据卷后,以后修数据改只需要在本地即可,容器内会自动同步,同理,也可修改容器数据,主机挂载目录将自动同步。方式一:直接使用命令来挂载 -vdocker run -it -v 主机目录:容器内目录$docker run -it -v /home/hongsen/data/test:/home centos /bin/bash # 主机不存在目录/h

2021-10-03 16:29:52 114

原创 Task02:Docker镜像与容器

学习资料:【狂神说Java】Docker最新超详细版教程通俗易懂DataWhale Docker开源教程文章目录Docker镜像与容器列出所有的运行的容器退出容器删除容器启动和停止容器的操作常用其他命令后台启动容器查看日志查看容器中进程信息查看镜像的元数据进入当前正在运行的容器Docker镜像与容器#下载一个centos镜像来测试docker pull centos#新建容器并启动docker run [可选参数] image#参数说明--name="Name" 容器名字,tomc

2021-09-16 10:58:43 57

原创 Task01:简介与安装

学习资料:【狂神说Java】Docker最新超详细版教程通俗易懂DataWhale Docker开源教程官方文档1.安装win10系统:家庭中文版v1909WSL Ubuntu18.04# 添加使用https传输的软件包和CA证书sudo apt-get install apt-transport-https ca-certificates curl gnupg lsb-release# 为确认所下载软件包的合法性,需要添加软件源的GPG秘钥curl -fsSL https://mi

2021-09-16 10:57:41 115

原创 Task11综合练习

Task11综合练习文章目录【任务四】显卡日志【任务五】水压站点的特征工程学习参考:http://datawhale.club/t/topic/579/7【任务四】显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,

2021-01-13 23:38:44 133 1

原创 第十章 时序数据

学习参考:http://datawhale.club/t/topic/579文章目录Ex1:太阳辐射数据集Ex2:水果销量数据集Ex1:太阳辐射数据集import numpy as npimport pandas as pdimport matplotlib.pyplot as plt现有一份关于太阳辐射的数据集:df = pd.read_csv('../data/solar.csv', usecols=['Data','Time','Radiation','Temperature'])d

2021-01-10 22:30:57 409

原创 第九章 分类数据

第九章 分类数据学习参考:http://datawhale.club/t/topic/579文章目录第九章 分类数据Ex1:统计未出现的类别Ex2:钻石数据集Ex1:统计未出现的类别在第五章中介绍了crosstab函数,在默认参数下它能够对两个列的组合出现的频数进行统计汇总:df = pd.DataFrame({'A':['a','b','c','a'], 'B':['cat','cat','dog','cat']})pd.crosstab(df.A, df.B)但事实上有些列存储的是分类

2021-01-04 22:49:16 542 2

原创 第八章 文本数据

第八章 文本数据学习参考:http://datawhale.club/t/topic/579文章目录第八章 文本数据Ex1:房屋信息数据集Ex2:《权力的游戏》剧本数据集Ex1:房屋信息数据集现有一份房屋信息数据集如下:import numpy as npimport pandas as pddf = pd.read_excel('../data/house_info.xls', usecols=['floor','year','area','price'])df.head(3)将y

2021-01-03 20:21:41 336 4

原创 第七章 缺失数据

第七章 缺失数据学习参考:http://datawhale.club/t/topic/579文章目录第七章 缺失数据Ex1:缺失值与类别的相关性检验Ex2:用回归模型解决分类问题Ex1:缺失值与类别的相关性检验在数据处理中,含有过多缺失值的列往往会被删除,除非缺失情况与标签强相关。下面有一份关于二分类问题的数据集,其中X_1, X_2为特征变量,y为二分类标签。import numpy as npimport pandas as pdfrom scipy.stats import chi2d

2021-01-02 21:23:24 294 2

原创 综合练习

学习参考:http://datawhale.club/t/topic/579文章目录【任务一】企业收入的多样性【任务二】组队学习信息表的变换【任务三】美国大选投票情况【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:其中 p(xi)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份,在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据,在前一张表中增加一

2021-01-01 22:10:05 152

原创 第六章 连接

第六章 连接学习参考:https://github.com/datawhalechina/joyful-pandasEx1:美国疫情数据集现有美国4月12日至11月16日的疫情报表,请将New York的Confirmed, Deaths, Recovered, Active合并为一张表,索引为按如下方法生成的日期字符串序列:date = pd.date_range('20200412', '20201116').to_series()date = date.dt.month.astype('st

2020-12-29 23:12:42 109 1

原创 第五章 变形

学习参考:https://github.com/datawhalechina/joyful-pandasEx1:美国非法药物数据集现有一份关于美国非法药物的数据集,其中SubstanceName, DrugReports分别指药物名称和报告数量:dfpd.read_csv('../data/Drugs.csv').sort_values(['State','COUNTY','SubstanceName'],ignore_index=True)df.head(3)将数据转为如下的形式:将第

2020-12-27 23:57:31 86

原创 第六回:场景案例显神通

第六回:场景案例显神通学习参考:https://github.com/datawhalechina/fantastic-matplotlib作业1.用Drugs数据集,做出面积图的多子图形式。注意,需要添加如下要素:①添加每个子图标题,在子图右上方;②添加整个画布的总标题,在画布左上方;③添加X和Y轴的标签。import matplotlib.pyplot as pltimport numpy as npimport pandas as pd#导入数据集并转成方便作图的格式Dat

2020-12-27 16:03:17 125 6

原创 第四章 分组

第四章 分组学习参考:https://github.com/datawhalechina/joyful-pandasEx1:汽车数据集现有一份汽车数据集,其中Brand, Disp., HP分别代表汽车品牌、发动机蓄量、发动机输出。import numpy as npimport pandas as pddf = pd.read_csv('../data/car.csv')df.head(3)先过滤出所属Country数超过2个的汽车,即若该汽车的Country在总体数据集中出现次数不

2020-12-25 21:46:19 249 3

原创 python可视化 Task05 样式色彩秀芳华

第五回:样式色彩秀芳华学习参考:https://github.com/datawhalechina/fantastic-matplotlibhttps://matplotlib.org/tutorials/colors/colormaps.htmlhttps://zhuanlan.zhihu.com/p/141251520https://blog.csdn.net/sinat_32570141/article/details/105226330文章目录第五回:样式色彩秀芳华一、matplotli

2020-12-24 18:31:25 275

原创 第三章 索引

第三章 索引文章目录第三章 索引Ex1:公司员工数据集Ex2:巧克力数据集学习参考:https://github.com/datawhalechina/joyful-pandasimport numpy as npimport pandas as pdEx1:公司员工数据集现有一份公司员工数据集:df = pd.read_csv('../data/company.csv')df.head(3)分别只使用query和loc选出年龄不超过四十岁且工作部门为Dairy或Bakery的男性

2020-12-22 23:13:08 243

转载 python可视化 Task04 文字图例尽眉目

学习参考:https://github.com/datawhalechina/fantastic-matplotlibhttps://www.jb51.net/article/164187.htm文章目录一.Figure和Axes上的文本一.Figure和Axes上的文本Matplotlib具有广泛的文本支持,包括对数学表达式的支持、对栅格和矢量输出的TrueType支持、具有任意旋转的换行分隔文本以及Unicode支持。下面的命令是介绍了通过pyplot API和objected-orie

2020-12-21 23:49:11 174 1

原创 python可视化 Task03

学习参考:https://github.com/datawhalechina/fantastic-matplotlib文章目录1. 墨尔本1981年至1990年的每月温度情况2. 画出数据的散点图和边际分布import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axes.unicode_minus']

2020-12-20 18:07:42 259 2

原创 第二章 pandas基础

第二章 pandas基础文章目录第二章 pandas基础Ex1:口袋妖怪数据集Ex2:指数加权窗口【练一练】rolling对象的默认窗口方向都是向前的,某些情况下用户需要向后的窗口,例如对1,2,3设定向后窗口为2的sum操作,结果为3,5,NaN,此时应该如何实现向后的滑窗操作?(提示:使用shift)s = pd.Series([1, 3, 6, 10])s.expanding().mean()Ex1:口袋妖怪数据集现有一份口袋妖怪的数据集,下面进行一些背景说明:#代表全国图鉴编号

2020-12-19 22:52:54 345 1

转载 第二回:艺术画笔见乾坤

文章目录1.matplotlib绘图逻辑2.primitives基本要素2.1 2DLines类2.2 patches2.2.1 Rectangle-矩形2.2.2 Polygon-多边形2.2.3 Wedge-契形2.3 collections类2.4 images类3 对象容器 - Object container3.1 Figure容器3.2 Axes容器3.3 Axis容器3.4 Tick容器学习参考:https://github.com/datawhalechina/fantastic-ma

2020-12-18 23:39:51 449 2

原创 Task01:预备知识

Task01:预备知识Ex1:利用列表推导式写矩阵乘法Ex2:更新矩阵Ex3:卡方统计量Ex4:改进矩阵计算的性能Ex5:连续整数的最大长度参考链接:https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch1.htmlEx1:利用列表推导式写矩阵乘法一般的矩阵乘法根据公式,可以由三重循环写出,请将其改写为列表推导式的形式。import numpy as npM1 = np.random.rand(

2020-12-16 01:08:51 189 1

原创 python可视化Task01

python可视化Task01我学绘图是从R语言起步的,R语言在绘图方面有很成熟的ggplot2包和衍生出的成熟生态,市面上也有很多不错的书籍资料,对ggplot2图层叠加的绘图思想讲解也比较透彻。但后面感觉到R在数据处理方面的效率比不上python(数据只能在经过一系列清洗转换成data.frame或者tibble格式后才能绘图,而这一系列的清洗转换我觉得python的支持更完美,因此不同编程语言间数据对象的切换使用只能依赖文本文件之间的转换,个人希望一种编程语言就完成数据的清洗和展示,因而转向pyth

2020-12-14 19:42:36 88

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除