自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 《统计学习方法》学习笔记_感知机(手写扫描)

感知机Perceptron由Rosenblatt于1957年提出,可以说是神经网络与支持向量机的爸爸。感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。感知机学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。感知机预测是用学习得到的感

2022-03-24 23:17:57 445

原创 《深度学习的数学》学习笔记(手写扫描)

《深度学习的数学》(人民邮电出版社)本书主要介绍了阶层型神经网络、卷积神经网络、梯度下降法以及误差反向传播法(BP)。书中语言风格比较俏皮,深入浅出。就是实战用的是Excel这点比较有个性…...

2022-03-21 18:27:53 1179

原创 《神经网络与深度学习》学习笔记_表示学习

表示学习:如何自动从数据中学习好的表示通过构建具有一定“深度”的模型,可以让模型来自动学习好的特征表示(从底层特征,到中层特征,再到高层特征),从而最终提升预测或识别的准确性原始数据——底层特征——中层特征——高层特征——预测——结果其中,“底层特征——中层特征——高层特征”称为表示学习1.特征提取VS表示学习特征提取:基于任务或先验对去除无用特征并不保证对分类器的结果有提供与帮助表示学习:通过深度模型学习高层语义特征对后续分类器有帮助难点在于没有明确目标2.表示学习与深度学习一个.

2022-03-18 21:22:33 863

原创 《机器学习算法竞赛实战》学习笔记4.特征工程

吴恩达老师有言:“机器学习在本质上还是特征工程,数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限而已。”特征工程主要分为:数据预处理、特征变换、特征提取、特征选择四部分#mermaid-svg-Ybe7a9ZvmxjBI7JK {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-Ybe7a9ZvmxjBI7JK .error-icon{fill:#552222;}

2022-03-15 19:47:03 1904

原创 学习简记_特征工程

特征工程1.特征变换1.1连续变量无量纲化1.2连续变量离散化1.3类别特征转换2.特征组合3.特征评价吴恩达老师有言:“机器学习本质上还是特征工程,数据和特征决定了机器学习上限,模型和算法只是去尽可能逼近这个上限而已。”特征工程是基于原始特征,可以用变换、组合、评价优选及学习等方法来获得更强区分能力的特征。1.特征变换1.1连续变量无量纲化无量纲化指将不同规格的数据转换到同一规格,常见方法有标准化和区间缩放法。由于标准化的前提条件是特征值服从正态分布,略歪的可先用log处理。区间放缩法,常见利用

2022-03-04 23:33:21 580

原创 Mathematically lucky tickets

同学的一道题,这一看就该上暴力枚举啊!思忖良久后,上网搜了一下大佬的解法,比自己想的妙多了,于是大体上参照着那份做了点注释。(但总感觉在切片上还可以更优),目前没什么更好的思路,先记下虽然题目洋洋洒洒,但实际上就是:将一个六位数切割成几个整数,整数间可以加减乘除组合,如果有一种组合的值为100,则该六位数不lucky,输出Falsefrom itertools import product #product(list1,list2)就是依次从list1,list2中各取一个元素,俩元素组成一个tup

2022-02-27 13:43:08 217

原创 Python从文件夹中批量读取文件(显示进度)

如何从文件夹中批量读取图像,并划分数据集返回的是列表import osimport tqdmfrom tqdm import tqdm #显示进度from imageio import imreadfrom sklearn.model_selection import train_test_splitx=[]y=[]def INPUT_IMAGE(TRAIN_IMG_PATH,TRAIN_MASK_PATH): for filename in tqdm(os.listd

2022-02-25 14:52:49 2955

原创 模型的保存与下载

我们需要在模型训练完成后将模型保存到文件系统上,以便于我们后续的测试与部署。在训练大规模的网络时,为了减少在训练过程中被中断/宕机意外的损失,间歇性保存模型状态是个好习惯。1.张量方式model.save_weights('weights.ckpt')这种保存与加载网络的方式最为轻量级,文件中仅保存参数张量的数值,并没有额外的结构参数。但它需要使用相同的网络结构才能够恢复网络状态,因此一般在拥有网络源文件的情况下使用2.网络方式通过Model.save(path)函数可以将模型的结构以及模型的参

2022-02-22 23:08:46 1280

转载 真实场景篡改图像检测挑战赛

大赛名称:真实场景篡改图像检测挑战赛赛季名称:初赛数据形式数据包括训练集和测试集,训练集有4000张JPEG图像及对应Mask(分辨率与原图保持一致,像素值0表示该像素标识为未篡改,像素值1表示该像素标识为篡改),JPEG图像的EXIF信息均被擦除,除部分无后处理外,其它可能经过裁边、平滑、下采样、社交工具传输(没有使用组合方式);测试集有4000张JPEG图像,处理过程与训练集一致;允许使用集外数据进行训练学习。参赛者提交数据时,利用我们提供的python程序生成Mask,对4000张Mask打包

2022-02-18 23:44:07 734

原创 Python实用文档(持更)

学习时找到的文档收纳,持续更新

2022-02-16 20:28:24 785

原创 《机器学习算法竞赛实战》学习笔记3.数据探索

如何确保自己准备好竞赛使用的算法模型?如何为数据集选择最合适的算法?如何定义可用于算法模型的特征变量?数据探索可以帮助回答以上三点。一般而言,数据探索可以分为三个部分:首先是赛前数据探索,帮助我们对数据有个整体性的认识,并发现数据中存在的问题,比如缺失值、异常值和数据冗余等其次是竞赛中的数据探索,通过分析数据发现变量的特点,帮助提取有价值的特征,这里可以从单变量、多变量和变量分布进行分析最后是模型的分析,可以分为重要性分析和结果误差分析,帮助我们从结果发现问题,并进一步优化#mermaid-s

2022-02-15 23:47:44 993

原创 《机器学习算法竞赛实战》学习笔记2.问题建模

拿到赛题,应首先考虑问题建模,同时完成基线(baseline)模型的管道(pipeline)搭建,以第一时间获得结果上的反馈。竞赛中的问题建模主要可分为赛题理解、样本选择、线下评估策略三个部分。#mermaid-svg-5v7qW5VKF9awDP2Q .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-5v7qW

2022-02-14 16:06:04 937

原创 模型评估与选择

第2章 模型评估与选择1.经验误差与过拟合错误率(error rate):分类错误的样本数占样本总数的比例精度(accuracy):1-错误率误差(error):学习器的实际预测输出与样本真实输出之间的差异训练误差(training error)/经验误差(empirical error):学习器在训练集上的误差泛化误差(generalization error):学习器在新样本上的误差过拟合(overfitting):过配,把训练样本本身的一些特点当作了所有潜在样本都会具有的一般性质,大

2022-02-13 23:44:19 667

原创 《机器学习算法竞赛实战》学习笔记1.竞赛简介

本文是《机器学习算法竞赛实战》(人民邮电出版社)的笔记的第一篇,希望可以通过这样的方式督促自己学习。第1章.初见竞赛1.竞赛平台简介1.1Kaggle1.1.1概况Overview1.1.2数据Data1.1.3代码笔记Code1.1.4论坛Discussion1.1.5排行榜Leaderboard1.1.6规则Rules1.2天池1.3DataFountain(DF)1.4DataCastle(DC)1.5Kesci1.6JDATA2.竞赛流程2.1问题建模2.2数据探索2.3特征工程2.4模型训练2.

2022-02-11 18:55:04 1322 4

原创 基于OpenCV的简易实时手势识别(含代码)

基于OpenCV的简易实时手势识别1.基本信息介绍1.1实验步骤1.2效果展示2.肤色检测+二值化+开运算+高斯模糊2.1 flip()函数原型2.2cvtColor()函数原型2.3split()函数原型2.4GaussianBlur()函数原型2.5Code3.连通空心部分+腐蚀3.1 floodFill()函数原型3.2 morphologyEx()函数原型3.3Code4.多边形拟合曲线4.1approxPolyDP()函数原型4.2Code5.凸包检测+重心+ 鼠标操作5.1convexHull(

2022-02-02 16:57:10 16007 10

原创 Numpy基础

扩展库Numpy简介参考资料:《Python可以这样学》(董付国)本文原来是写在jupyter notebook上的,转成了.md格式再复制到这里来的,如果你觉得这样看起来不方便,需要.ipynb格式,请私信我:)文章预览:扩展库Numpy简介1.生成数组2.数组与数值的算术运算3.数组与数组的算术运算4.二维数组转置5.向量内积6.数组元素访问多元素同时访问7.对数组进行函数运算8. 对矩阵不同维度上的元素进行计算9. 改变数组大小10.切片操作11.布尔运算12.广播13.分段函数14.计算唯一值

2022-01-30 22:34:40 603

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除