![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Datawhale学习
ClFH
new 一个未来
展开
-
数据可视化_matplotlib_Task04_文字图例尽眉目
Task04_文字图例尽眉目1、Task04_文字图例尽眉目1.1、text1.2、title和set_title1.3、figtext和text1.4、suptitle1.5、xlabel和ylabel1.6、annotate1.7、字体的属性设置1.8、数学表达式1、Task04_文字图例尽眉目Matplotlib具有广泛的文本支持,包括对数学表达式的支持、对栅格和矢量输出的TrueType支持、具有任意旋转的换行分隔文本以及Unicode支持。下面的命令是介绍了通过pyplot API和obje原创 2020-12-22 23:09:42 · 398 阅读 · 0 评论 -
数据可视化_matplotlib_Task03_布局格式定方圆
这里写目录标题1、子图1.1、 使用 plt.subplots 绘制均匀状态下的子图1.2、使用 GridSpec 绘制非均匀子图2、子图上的方法3、作业3.1、墨尔本1981年至1990年的每月温度情况3.2、画出数据的散点图和边际分布import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axes.u原创 2020-12-20 23:30:05 · 169 阅读 · 0 评论 -
数据可视化_matplotlib_Task02_艺术画笔见乾坤
Task02_艺术画笔见乾坤1、概述1.1、matplotlib的三层api1.2、Artist的分类1.3、matplotlib标准用法2、自定义你的Artist对象2.1、Artist属性2.2、属性调用方式3、基本元素 - primitives3.1、2DLines3.1.1、如何设置Line2D的属性3.1.2、如何绘制lines3.2、patches3.2.1、Rectangle-矩形3.2.2、Polygon-多边形3.2.3、Wedge-契形3.3、collections3.4、images4原创 2020-12-14 14:20:20 · 524 阅读 · 1 评论 -
数据可视化_matplotlib_Task01_Matplotlib简介
Task01_Matplotlib简介1、认识matplotlib2、一个简单的绘图例子3、Figure的组成4、两种绘图接口1、认识matplotlibMatplotlib是一个Python 2D绘图库,能够以多种硬拷贝格式和跨平台的交互式环境生成出版物质量的图形,用来绘制各种静态,动态,交互式的图表;Matplotlib可用于Python脚本,Python和IPython Shell、Jupyter notebook,Web应用程序服务器和各种图形用户界面工具包等;Matplotlib是Pyt原创 2020-12-14 09:23:00 · 157 阅读 · 0 评论 -
Datawhale_街景字符编码识别-Task5—模型集成
Task5—模型集成1、模型集成1.1、Dropout1.2、TTA1、模型集成在深度学习中本身就有一些集成学习思路的做法1.1、DropoutDropout可以作为训练深度神经网络的一种技巧。在每个训练批次中,通过随机让一部分的节点停止工作。同时在预测的过程中让所有的节点都其作用。Dropout经常出现在在先有的CNN网络中,可以有效的缓解模型过拟合的情况,也可以在预测时增加模型的精度。加入Dropout后的网络结构如下:# 定义模型class SVHN_Model1(nn.Module)原创 2020-06-02 22:47:08 · 157 阅读 · 0 评论 -
Datawhale_街景字符编码识别-pytorch.transforms数据增强
街景字符编码识别-Task41、构建数据集2、参数设置3、定义模型3.1、使用VGG16迁移学习1、构建数据集trainGen = keras.preprocessing.image.ImageDataGenerator(rescale=1./255, rotation_range=40,原创 2020-05-30 23:43:21 · 416 阅读 · 0 评论 -
Datawhale_街景字符编码识别-Task3—字符识别模型
街景字符编码识别-Task3模型构建模型构建#深度神经网络model = keras.models.Sequential()#定义第一个卷积层model.add(keras.layers.Conv2D(filters = 32, #32个通道(32个卷积核) kernel_size=3, #卷积核大小为3 padding='sa原创 2020-05-27 20:29:16 · 369 阅读 · 1 评论 -
Datawhale_街景字符编码识别-Task2—图像数据读取与数据增广
Task2—数据读取与数据扩增读取前四张图片的标签及图片读取前四张图片的标签及图片 imgs = glob.glob(data_dir['train_data']+'*.png')fig, ax = plt.subplots(figsize=(12, 8), nrows=2, ncols=2)marks = pd.read_json(data_dir['train_label'])for i in range(4): img_name = os.path.split(imgs[原创 2020-05-25 19:47:34 · 271 阅读 · 0 评论 -
Datawhale_街景字符编码识别-Task1—数据加载及预处理
数据加载及预处理1、文本数据预处理1.1、标签数据处理1.2、图片数据处理1、文本数据预处理1.1、标签数据处理可以将赛题抽象为一个定长字符识别问题,在赛题数据集中大部分图像中字符个数为2-4个,最多的字符个数为6个大多数的数字序列都是2或3的序列,只有一个来自训练集的例子在序列中有6个数字。该网络的设计目标是识别最多5位数字。网络输出6个值,前5个对应序列中的每个数字(输出10表示为空数字),最后一个值是序列中除去填充值有多少个位数。加载训练数据标签import globmetadata原创 2020-05-20 22:52:54 · 232 阅读 · 0 评论 -
机器学习Task5支持向量机SVM
学习内容SVM 硬间隔原理- SVM 软间隔- SMO 求解SVM- 代码设计### 1、硬间隔本文是需要一定基础才可以看懂的,建议先看看参考博客,一些疑惑会在文中直接提出,大家有额外的疑惑可以直接评论,有问题请直接提出,相互交流。### SVM-统计学习基础一开始讲解了最小间距超平面:所有样本到平面的距离最小。而距离度量有了函数间隔和几何间隔,函数间隔与法向量www和bbb有关,www变为2...原创 2020-05-02 05:50:04 · 147 阅读 · 0 评论 -
Task4条件随机场CRF
Task4条件随机场CRF条件随机场概述1 产生式模型和判别式模型( Generative model vs Discriminative model )1.1 模型简介1.2 模型比较1.3 模型之间的关系2 概率图模型( Graphical Models )3 朴素贝叶斯分类器( Naive Bayes Classifier )4 隐马尔可夫模型( Hidden Markov Mode...原创 2020-04-28 10:47:11 · 404 阅读 · 0 评论 -
pandas Task3分组
pandas Task3分组加载数据1 SAC过程1.1 内涵1.2 apply过程2 groupby函数2.1 分组函数的基本内容:2.2 groupby对象的特点3 聚合、过滤和变换3.1 聚合(Aggregation)3.2 过滤(Filteration)3.3 变换(Transformation)4 apply函数4.1 apply函数的灵活性4.2 用apply同...原创 2020-04-26 22:50:05 · 181 阅读 · 0 评论 -
机器学习Task3EM算法
Task3EM算法EM算法EM算法EM算法更多是一种思想,用概率来解决问题的一种方法,具体的代码看自己选用模型,所以并没有通用的模型,本此代码主要是讲解混合高斯分布模型的这其中的M步 完全按照了 公式来计算import numpy as npimport randomimport mathimport time生成数据集'''数据集:伪造数据集(两个高斯分布混合)数据集...原创 2020-04-26 21:44:59 · 241 阅读 · 1 评论 -
pandas Task2索引
第2章 索引import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv',index_col='ID')df.head() School Class Gender Address Height Weig...原创 2020-04-23 21:11:56 · 150 阅读 · 0 评论 -
机器学习Task2
知识点梳理相关概念(生成模型、判别模型)先验概率、条件概率贝叶斯决策理论贝叶斯定理公式极值问题情况下的每个类的分类概率下溢问题如何解决零概率问题如何解决?优缺点sklearn参数详解,Python绘制决策树sklearn接口from sklearn.naive_bayes import GaussianNBfrom sklearn.datasets import loa...原创 2020-04-23 20:59:42 · 246 阅读 · 0 评论 -
机器学习基础
线性回归的概念1、线性回归的原理2、线性回归损失函数、代价函数、目标函数3、优化方法(梯度下降法、牛顿法、拟牛顿法等)4、线性回归的评估指标5、sklearn参数详解1、线性回归的原理进入一家房产网,可以看到房价、面积、厅室呈现以下数据: 面积($x_1$) 厅室数量($x_2)$ 价格(万元)(y) ...原创 2020-04-21 11:05:00 · 167 阅读 · 0 评论 -
pandas学习
pandas基础1 查看pandas版本pd.__version__2 文件读取与写入2.1 读取csv格式df = pd.read_csv('data/table.csv')df.head()txt格式df_txt = pd.read_table('data/table.txt') #可设置sep分隔符参数df_txtxls或xlsx格式#需要安装x...原创 2020-04-21 09:50:01 · 330 阅读 · 0 评论