自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

聚集机器学习、信息安全

每一个不曾起舞的日子 都是对生命的辜负

  • 博客(10)
  • 资源 (6)
  • 收藏
  • 关注

原创 Machine Learning-L5-回归分析

线性回归:使用线性模型拟合数据输入和输出之间的映射关系。在线性回归中,试图找到一条直线(一个超平面),使所有样本到直线上(超平面上)欧氏距离(Euclidean distance)之和最小(均方误差对应欧式距离)。

2020-03-30 23:18:12 482

原创 SVM(五):SVM小结

SVM在解决高维特征的分类问题和回归问题很有效,在特征维度大于样本数时依然有很好的效果。 仅仅使用一部分支持向量来做超平面的决策,无需依赖全部数据。有大量的核函数可以使用,从而可以很灵活的来解决各种非线性的分类回归问题。 样本量不是海量数据的时候,分类准确率高,泛化能力强。但是SVM在样本量非常大,核函数映射维度非常高时,计算量过大,不太适合使用。非线性问题的核函数的选择没有通用标准,难以选择一个合适的核函数。特征维度远远大于样本数时,表现一般。

2020-03-21 22:20:24 838

原创 SVM(四):支持向量回归

4. 支持向量回归4.1 问题定义4.2 对偶问题

2020-03-12 22:27:02 1066

原创 SVM(三):非线性支持向量机

现实任务中,训练样本经常不是线性可分的,即原始样本空间中并不存在一个能正确划分两类样本的超平面。对于这样的问题,基于Mercer核展开定理,通过内积函数定义的非线性变换,将样本从原始空间映射到一个高维特征空间(Hibbert空间),使得样本在这个高维特征空间内线性可分(升维线性化)。

2020-03-11 23:41:49 2176

原创 SVM(二):软间隔与正则化

硬间隔(hard margin)要求所有样本均满足约束,即所有样本都必须划分正确。软间隔(soft margin)允许某些样本不满足约束,即允许支持向量机在一些样本上出错。

2020-03-10 23:23:13 1725

原创 SVM(一):线性支持向量机

1.1 问题定义(1) 划分超平面(2) 点到超平面的距离(3)支持向量、间隔(4)最优超平面1.2 对偶问题1.3 问题求解

2020-03-09 23:32:49 1197 1

原创 Machine Learning-L8-SVM:支持向量机全面解析

支持向量机(Support Vector Machine)由Cortes 和Vapnik于1995年正式发表("Support vector networks", Machine Learning, 20(3):273-297),由于在二维表分类任务中显示出卓越性能,很快成为机器学习的主流技术,并在2000年掀起了统计学习的高潮。

2020-03-08 23:34:31 805

原创

1 信息熵熵的概念首先在热力学中引入,用于度量一个热力学系统的无序程度。1948年,C.E. Shannon 在《A Mathematical Theory of Communication》第一次提出了信息熵。信息熵(Entropy)是信息的不确定性(Uncertainty)的度量,不确定性越大,信息熵越大。信息用来消除事件的不确定性,即消除熵=获取信息。消除熵可以通过调整事件概率、排...

2020-03-07 23:21:58 640

原创 TensorFlow 添加卷积层

Tensorflow中提供了tf.nn.conv2d与tf.layers.conv2d用于添加卷积层,两者功能类似,后者为更高一级的api,和keras.layer类似。前者的激活函数需要另外代码,后者的激活函数是一个参数,不需要另外代码。1. tf.nn.conv2dtf.nn.conv2d( input, filter, strides, padding,...

2020-03-01 16:16:13 1827

原创 TensorFlow 添加全连接层

Tensorflow中提供了tf.layers.dense()与tf.contrib.layers.fully_connected用于添加全连接层,两者功能一样,后者在前者基础上封装实现。1. tf.layers.dense()tf.layers.dense( inputs, units, activation=None, use_bias=True, ...

2020-03-01 14:29:48 3581

2023全球隐私计算报告

2023年11月23日,由浙江省人民政府、商务部共同主办,杭州市人民政府、浙江省商务厅、商务部贸发局共同承办的第二届全球数字贸易博览会在杭州国际博览中心成功举办。 会上正式发布《2023全球隐私计算报告》正式发布! 隐私计算是数据要素安全流通的关键技术之一,其发展对于数据要素的价值释放具有重要意义。报告立足全球视角,深度调研全球隐私计算行业的最新进展,并通过政策、技术、市场应用和开源等多角度对隐私计算行业2023年的发展现状及发展趋势进行调研和分析,揭示隐私计算在数据要素安全流通中的重要作用,共同促进数据要素市场的蓬勃发展!

2023-11-27

安全多方计算框架论文合集(持续更新)

现有安全多方计算/学习框架论文合集,具体包括ABY、ABY3等16个框架相关论文,可以对了解安全多方计算的研究者起到作用。

2023-10-22

sqluldr2.exe

sqluldr2

2023-06-23

oracle分区技术-大批量数据操作.ppt

oracle分区技术-大批量数据操作

2023-06-23

Oracle数据库高级技术交流计划-性能调优.ppt

Oracle数据库高级技术交流计划-性能调优

2023-06-23

Oracle优化器介绍(精简完善版).doc

Oracle优化器介绍(精简完善版)

2023-06-23

ORACLE_SQL性能优化(全).ppt

ORACLE_SQL性能优化(全)

2023-06-23

《现代密码学教程》PPT课件

《现代密码学教程》是北京邮电大学出版的现代密学的基础教材。 全书共分11章,主要分成4部分。 第1部分(第1~3章)主要介绍现代密码学的基础知识,包括密码学的基本概念、基本体制、基本思想以及所用到的理论知识等。 第2部分(第4~7章)主要介绍现代密码学的基本技术,包括对称密码技术(分组密码、序列密码)、Hash函数、公钥密码技术等。 第3部分(第8~10章)主要介绍现代密码学的基本应用,包括数字签名技术、密钥管理、密码协议等。 第4部分(第11章)对现代密码学的今后发展进行了展望。

2023-06-19

Oracle学习资料-中科院oralce教学ppt

非常详细的ppt课程资源,由中科院提供,共20讲,详细介绍了oracle的体系架构、SQL查询及优化、Oracle中各种对象的使用,是非常实用的Oracle学习资料。

2023-06-15

安全多方计算学习资料 - 6篇专著及论文

(1)David Evans、Vladimir Kolesnikov、Mike Rosulek,《A Pragmatic Introduction to Secure Multi-Party Computation》(中文版:《实用安全多方计算导论》) (2)Wenliang Du,Mikhail J. Atallah,《Secure Multi-Party Computation Problems and Their Applications:A Review and Open Problems》 (3)Oded Goldreich(以色列),《Secure Multi-Party Computation》 (4)Yehuda Lindell(以色列),《Secure Multiparty Computation》 (5)冯登国, 《Concretely efficient secure multi-party computation protocols: survey and more》 (6)Facebook AI Research,《CRYPTEN: Secure Mul

2023-06-15

机器学习领域:泰坦尼克号生还预测 数据集及完整代码

泰坦尼克号(Titanic),又称铁达尼号,是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉。1912年4月10日,她在驶往美国纽约的首次处女航行中,不幸与一座冰山相撞,1912年4月15日凌晨,泰坦尼克号永久沉入大西洋底3700米处,2224名船员及乘客中,逾1500人丧生。 机器学习领域,著名的数据科学竞赛平台kaggle的入门经典也是以泰坦尼克号事件为背景。 该问题通过训练数据(train.csv)给出891名乘客的基本信息以及生还情况,通过训练数据生成合适的模型,并根据另外418名乘客的基本信息(test.csv)预测其生还情况。 详见博文 https://blog.csdn.net/apr15/article/details/129599110

2023-04-13

Python时间序列分析数据集

用于进行Python时间序列分析的数据集,包含苹果、微软等公司自1990年以来每天的股票价格数据,共5473条,可以用作做时间序列分析。

2023-02-27

Gephi快速入门手册与数据集

Gephi被称为“数据可视化领域的Photoshop”,是一款开源免费跨平台基于JVM的复杂网络分析软件,主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。 该资源为Gephi官网的快速入门手册,附带数据集,实操易上手,具体可参见博文 https://blog.csdn.net/apr15/article/details/129207136

2023-02-24

MovieLen 1M版本(m1-1m.zip)数据集

MovieLens数据集(http://files.grouplens.org/datasets/movielens/ ) 是美国Minnesota 大学计算机科学与工程学院的 GroupLens 项目组采集的一组从20世纪90年代末到21世纪初由MovieLens用户提供的电影评分数据,该数据集包括电影评分、电影元数据(时间与类型)以及关于用户的数据(年龄、性别、职业、邮编)。 MovieLen 1M版本(m1-1m.zip)数据集包括三个文件:用户信息、影片信息(1919-200年的3883部电影)、评分信息,readme为说明文件,包括了年龄和职业的编码说明。

2022-01-24

NLP-Word2Vec.rar

本资源包含Mikolov 关于Word2Vec四篇经典论文以及《人民的名义》语料 用于Word2Vec学习以及应用练习

2020-08-15

VGG16图像分类源代码、测试图片

VGG16图像分类源代码、测试图片下载。

2020-06-07

minist_demo.py

MNIST手写数字识别数据集是NIST数据集的一个子集(介绍),常用于深度学习的入门样例。使用python语言构建神经网络实现手写数字识别。

2020-05-23

minist_demo.py

MNIST手写数字识别数据集常用于深度学习的入门样例,使用python语言构建神经网络实现手写数字识别。

2020-05-23

lshort-cn.rar

LATEX是一种排版系统,它非常适用于生成高印刷质量的科技和数学类文档。这个系统同样适用于生成从简单的信件到完整书籍的所有其他种类的文档。LATEX 使用TEX作为它的格式化引擎,这份短小的介绍描述了LATEX2使用。 原版作者:Tobias Oetiker      Hubert Partl, Irene Hyna and Elisabeth Schlegl

2020-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除