自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 PDF裁切 python3D柱状图

PDF大小裁切网站python 3D柱形图代码import numpy as npimport matplotlib.colors as colorsimport matplotlib.cm as cmx = np.array(range(6),float)y = x.copy()xpos, ypos = np.meshgrid(x,y)xpos = xpos.flatten()ypos = ypos.flatten()# ARIz = np.array([[0.752,0.793,0

2021-08-13 14:32:17 209

原创 激活函数的选择

参考链接常见的激活函数:1、二元阶跃函数 x>=0f(x)=1,elsef(x)=0x>=0 f(x)=1, else f(x)=0x>=0f(x)=1,elsef(x)=0缺点:类别多不能用,求导为0不能反向更新参数2、线性函数f(x)=axf(x)=axf(x)=ax缺点:倒数为常数,与输入值无关3、Sigmoid: 1(1+e−x)\frac{1}{(1+e^{-x})}(1+e−x)1​ 将至转为(0,1)之间,其求导图如下由图可知,梯度在-3到3之间时有意义的,当

2021-06-18 13:38:41 1377

原创 半监督、自学习、伪标签文献阅读

伪标签方法存在确认偏差(confirmation bias)也可以叫做噪声累计(noise accumulation)Joint Optimization Framework for Learning with Noisy Labels摘要:针对标签有噪声的数据集训练的网络性能下降问题,作者提出了一种联合更新网络参数和标签的方法。问题:该文指出在噪声标签数据集训练DNN的主要问题是由于深度神经网络可以学习或者记忆任何训练数据集,意味着深度神经网络对噪声数据也是过拟合的。作者发现高学习率抑制DNN的记

2021-06-17 09:18:45 1108

原创 大数据学习笔记

原文链接大数据分析,gartner定义:通过信息资源进行深度理解进而做出相应决策,此类信息具有huge-volume,fast-velocity和different variety的特性。通过数据分析,解锁隐藏模式,了解更全面的了解客户从而更好的了解他们的需求。解决大数据存储和处理的技术包括Apache Hadoop、Apache Spark、Apache KafkaHadoop是一个开源框架,由java编写,可以在多个机器上同时进行并行处理,它使用集群架构,一个集群是一组通过局域网连接的系统。它包含

2021-06-06 22:41:33 154 2

原创 机器学习项目4聊天机器人

聊天机器人翻译链接 数据聊天机器人模型分为基于检索的模型和基于生成的模型基于检索的Chatbots 基于检索的聊天机器人使用预定义的输入模式和回应。它使用某种启发式方法来选择适当的回应。基于生成的Chatbots 基于seq2seq 神经网络,将输入数据转为输出,需要大量数据。在此项目中,用一个特别热递归神经网络LSTM首先判断用户的信息属于哪个类,然后在该类中随机选一个回应。共5步分别是:1、 导入加载数据文件2、 处理数据3、 创建训练集和测试集4、 创建、训练、保存模型5、 预测与

2021-06-04 22:59:58 786 2

原创 机器学习项目3

股票价格预测数据集 代码目标1)用长短时记忆网络根据以往股票收盘价格预测后面一天的收盘价格2)可视化1 预测第一步: 导入模块import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom matplotlib.pylab import rcParamsrcParams['figure.figsize'] = 20,10from keras.models import Sequential# 网络层长

2021-06-04 16:29:16 372

原创 深度半监督学习

半监督学习介绍Zhu X, Goldberg A B. Introduction to semi-supervised learning[J]. Synthesis lectures on artificial intelligence and machine learning, 2009, 3(1): 1-130.链接半监督无监督学习:主要目的是从独立同分布采样中得到的n个独立样本中找到intresting的结构监督学习:从给定的一组训练集(x,y)中学习从x到y的映射,训练集也属于独立同分布,学

2021-03-09 15:29:41 2664

原创 机器学习项目2

用深度学习创建自己的表情翻译地址源连接通过该深度学习(卷积神经网络)项目,对脸部表情分类在将分好类的情绪映射为为相应的表情。数据集FER2013数据集(面部表情识别)由48*48像素的灰度人脸图像组成。图像居中并占据等量的空间。本数据集由以下类别的面部情绪组成0:angry(生气)1:disgust(嫌弃)2:fear(害怕)3:happy(开心)4:sad(伤心)5:surprise(惊讶)6:neutral第一步 导入库import numpy as npimport cv2

2021-03-07 10:23:21 756 2

原创 机器学习项目1图片卡通化

图片转为漫画翻译链接图片漫画化第一步:导入需要的库导入OpenCV库用于图片处理导入easygui导入numpy 图片存储和处理为数字导入imageio导入matplotlibOS 操作系统交互,这里主要时读取和存储图片路径import cv2 #用于图像处理import easygui #import numpyimport imageioimport sysimport matplotlib.pyplot as pltimport osimport tkinter as

2021-03-04 16:42:34 598 1

原创 机器学习 day7

K近邻算法K近邻算法是一种常用为分类算法,也可以用于回归,无需参数学习,基于实例,在一个有监督的学习环境中使用。K-NN的三个关键元素是一些标记数据、数据间的距离、K值距离度量常用欧式距离给灰点上色计算灰点与最近K个有色点之间的距离投票,最近点中颜色最多的为灰点的颜色第一步 数据预处理 第二步 配置训练 第三步 测试 第四步 生成混淆矩阵import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom m

2021-03-02 13:55:24 61

原创 机器学习 day4-6

逻辑回归逻辑回归用于分类问题,主要是在观测数据下,预测当前点属于哪个类别。简单的二分类,输出0,1,例如一个人在选举中是否会投票。逻辑回归输出是离散的线性回归输出是连续的将概率转换为0,1的预测结果的任务叫做逻辑回归或者Sigmode函数。Sigmoid 函数取值范围[0,1], 定义域(-∞,+∞)...

2021-03-02 13:14:35 120

原创 机器学习3

多元线性回归原链接源连接通过观察到的数据适配一个线性方程来建立2个或者2个以上特征X与一个response Y的关系。y = b0+b1x1+b2x2+…+bnxn假设:1)自变量和因变量是线性关系2)应该维持预测与观察值间的方差齐性(常数方差)3)观测值与预测值之间的差属于正态分布4) 缺乏多重共线性(当特征间存在不相互独立会出现多重共线性)注意:特征数过多影响准确率,可以 通过一些方法选择恰当的特征变量:Faward Selection(从0往模型里面增加特征,每次增加提升模型最大准确

2021-03-01 16:08:16 62

原创 机器学习Day2

简单的线性回归英文原链接源链接假设: X和Y是线性相关的则需要找到一个关于X的线性函数来尽可能准确的预测Y。y = a0+ a1x1怎样找到最合适的回归线?通过最小化预测值和观测值的均方差第一步 数据的预处理导入库、导入数据集、检查缺失数据、分离训练集和测试集、特征缩放第二步 为训练集适配简单的线性回归模型从sklearn.linear_model中导入LinearRegression类。通过LinearRegression生成一个regressor对象通过LinearRgressi

2021-03-01 15:09:15 297

原创 机器学习-Day1

Day1 数据预处理第一步:导入需要的库第二步:导入数据集第三步 处理缺失数据第四步 编码分类数据第五步:将数据集划分为训练集和测试集第六步 特征缩放翻译转载源地址第一步:导入需要的库两个基本库:Numpy 包含数学方面的函数、Panda用于导入和管理数据集第二步:导入数据集数据集一般是.csv格式,该格式文件存储了列表式的纯文本数据。每行是一个记录。用panda库中read_csv的方法来读取本地的csv文件,作为一个dataframe。 然后从dataframe里面分离出自变量和因变量的矩阵和

2021-03-01 14:44:17 102 1

原创 semi、unsupervised3

Article:Shorten C, Khoshgoftaar T M. A survey on image data augmentation for deep learning[J]. Journal of Big Data, 2019, 6(1): 60.Article: Zhong Z, Zheng L, Kang G, et al. Random Erasing Data Augmentation[C]//AAAI. 2020: 13001-13008.Code:Article:Cubuk

2020-10-16 21:10:02 179

原创 semi、unsupervised2

leetcode题目:24. 两两交换链表中的节点# Definition for singly-linked list.# class ListNode:# def __init__(self, val=0, next=None):# self.val = val# self.next = nextclass Solution: def swapPairs(self, head: ListNode) -> ListNode:

2020-10-13 22:59:49 161

原创 semi、unsupervised1

记录1leetcode文献leetcode题目:530. 二叉搜索树的最小绝对差二叉树特点是每个结点最多只能有两棵子树,且有左右之分二叉查找树(Binary Search Tree),(又:二叉搜索树,二叉排序树)它或者是一棵空树,或者是具有下列性质的二叉树: 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值; 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值; 它的左、右子树也分别为二叉排序树前序遍历(DLR) 、中序遍历(LDR)、 后序遍历(LRD)中序遍历(LDR

2020-10-13 09:01:51 177

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除