自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (1)
  • 收藏
  • 关注

原创 机器学习笔记整理[第1天]

马尔科夫链定义:每个状态的转移概率依赖于之前的n个状态,这个过程被称为1个n阶的模型。n是影响状态转移的数目,每个状态的转移只依赖于之前的那一个状态,那就是马尔科夫过程的1阶过程。如下:分为三个部分:1.状态;2.初始向量 3.状态转移矩阵隐马尔科夫过程:可观测到的状态序列和隐藏的状态序列时概率相关的,这种过程建模为一个隐藏的马尔科夫过程和一个与这个隐藏的马尔科夫过程是概率相关但是可观测到...

2019-04-19 11:43:19 172

原创 关于做项目的知识点总结以及心得体会【不间断更新】

1.pandas的读取文件一般文件为csv文件,python读取文件时使用read_csv函数,若在windows环境下读取文件,文件的路径名类似于:C:\Users\Administrator\Desktop\2020年20所项目相关资料\算法设计报告(v3)注意:1)两个反斜杠;2)路径名中可以有中文若读取的csv文件中含有列名称,那么直接读取后,文件中的列名称就是dataframe的列...

2020-04-26 11:31:52 251 1

原创 python、C++进行字符串拼接

1.python进行字符串拼接若变量和元素是字符串类型的,直接使用加号(+)进行拼接例如:输出结果是:若将字符串类型的变量和整数类型的变量进行拼接,则使用+str(number)将其拼接,如下所示:2.C++进行字符串拼接简单的方式是使用stringstream类,如下所示:就这样使用就行,也能看懂,智育stringstream类的详细说明,不需要了解...

2020-04-26 11:24:28 614

原创 c语言提高day01总结

1.听课标准1)选择法排序2)学习简单封装函数3)数组作为函数参数时会退化为一级指针 a)数组做函数参数时,数组个数也应该传递给函数 b)形参中的数组,,编译器将其作为指针处理,这是c语言特色 c)实参中的数组,和形参中的数组本质不一样 void fun(int a[]); main() { int a[] = {1,2,3};//12个字节 fun(a); }2....

2020-04-25 15:40:26 228

转载 如何实现python代码的整体缩进与退格

要实现python代码的整体缩进与退格,只需要选中代码,然后按相应的快捷键即可。其中:缩进 :Tab键退格 :Shift + Tab键本文链接:https://blog.csdn.net/C_chuxin/article/details/83379923...

2020-04-24 20:43:24 6007

原创 找工作面试准备集合(2019年7月4号)

先上一张图片,这张图片是这段时间看的资料的图谱的图片,感觉花了很久的时间。那么我们就按照上面的 图谱上的知识点,一点一点的进行下去。1、深度残差网络深度残差网络的理解:https://blog.csdn.net/dulingtingzi/article/details/79870486为什么进行深度残差网络的构造,原因是网络的层数越高,网络会遇到梯度消失问题,在前面网络层无法进行有效的...

2019-07-06 14:59:12 429

原创 自我提升的面试准备(6.28截止)

1.基学习器的结合方法1.1 绝对多数投票法标准的绝对多数投票法提供了“拒绝预测”选项,在可靠性要求高的情况下,可以不提供预测结果;1.2 加权多数投票法不同类型的基学习器产生不同的输出类型hij(x)h_{i}^{j}(\boldsymbol{x})hij​(x)值,常见的有:不同类型的hij(x)h_{i}^{j}(\boldsymbol{x})hij​(x)不能混用,分类器生...

2019-06-28 09:48:06 845 1

原创 推荐一个无敌的软件:可将图片直接转化为latex

软件介绍:可以直接截图,将图片公式直接转化为latex公式,用于csdn博客编写;也可以直接将latex公式转化为word文本里的公式,反正就是很简单,很好用。软件链接如下:https://mathpix.com/软件运行系统:mac os , windows , ubuntu...

2019-06-20 08:55:08 3904

转载 机器学习算法中 GBDT 和 XGBOOST 的区别有哪些?

转知乎wepon大神帖子:https://www.zhihu.com/question/41354392看了陈天奇大神的文章和slides,略抒己见,没有面面俱到,不恰当的地方欢迎讨论:传统GBDT以CART作为基分类器,xgboost还支持线性分类器,这个时候xgboost相当于带L1和L2正则化项的逻辑斯蒂回归(分类问题)或者线性回归(回归问题)。传统GBDT在优化时只用到一阶导数信息,xg...

2019-06-19 16:50:43 178

原创 机器学习实战中的心得体会

1.如何处理非均衡分类代价?如题目所讲,处理非均衡的分类代价的意思也就是当不同的分类预测正确或者错误时,其损失函数的代价是不同的;当真实值为+1,预测值为+1时,其代价值和真实值为-1,预测值为-1的代价值是不同的,在我们理解范围内,我们基本上认为这两个预测都是正确的,其代价值应该是一样的,但是分类的不同得到的收益是不同的,其代价函数也是不同的。上文中说道:分类真确和错误的代价值是不同的...

2019-06-11 11:18:02 2585

原创 TextRank算法

有关什么是抽取式自动摘要法?通过提取文档中已存在的关键词,句子形成摘要;text rank算法基于page rank算法,用于文本生成关键字和摘要。1.page rank?最开始page rank用来计算网页的重要性,网页可看做节点,若网页A到B存在一条链接,则表示从网页A到B有一条有向边。S(Vi)表示网页i的中重要性,d是阻尼指数,In(Vi)表示指向网页i的网页集合,Out(Vj...

2019-04-26 14:38:57 535 2

原创 卷积神经网络的心得体会

1.如何计算卷积后矩阵向量大小?feature_map尺寸的计算公式为:[(原图片尺寸-卷积核尺寸)/步长]+1,假如原图上尺寸大小是:33,卷积核大小是22,步长为1,则卷积后图片大小为,2*2;如下图卷积过程所示:2.为什么卷积核有效?我们知道,有些卷积核计算后的feature_map是一个3*3的矩阵数据,在第三列的绝对值最大,说明原始图片上对应的地方有一条垂直方向的特征,即像素数...

2019-04-25 22:14:25 4142

原创 最大似然函数和最小二乘法的区别和理解

最小二乘法和最大似然估计的区别和理解:它们的原理不同对于最小二乘法,当从模型中选择n个样本观察值时,参数的合理性要求就是让模型更好地拟合这个样本数据,就是让观察值和估计值之间的误差更小。而对于最大似然函数,当从模型中选择n个样本观察值时,合理的参数估计就是让从模型抽取这n个样本观察值的概率最大化。这是从不同的原理出发的两种参数估计法。在最大似然法中,通过选择参数,让已知数据在某种意义上最有可...

2019-04-22 20:08:36 8175 1

转载 LR和SVM的异同点

在大大小小的面试过程中,多次被问及这个问题:“请说一下逻辑回归(LR)和支持向量机(SVM)之间的相同点和不同点”。第一次被问到这个问题的时候,含含糊糊地说了一些,大多不在点子上,后来被问得多了,慢慢也就理解得更清楚了,所以现在整理一下,希望对以后面试机器学习方向的同学有所帮助(至少可以瞎扯几句,而不至于哑口无言ha(*^-^*))。(1)LR和SVM的相同点第一,LR和SVM都是...

2019-04-22 16:01:09 282

原创 机器学习之特征选择

补充:1.基于决策树选择特征,属于嵌入式特征选择方法,深度较浅的特征节点对应的分类能力越强大。满足条件1.深度较浅 2.特征出现次数较少2.L1正则化选择特征,没有选到的特征不代表不重要而是与其他的重复相关度高,再通过l2正则化进行交叉检验。3.用深度学习来自动选择特征,从深度学习模型中选择某一神经层的特征后就可以用来进行最终目标模型的训练了。参考文献:1.《美团机器学习实...

2019-04-19 10:21:07 213

原创 模糊K均值聚类算法

与K-means的不同之处在于:允许存在样本属于多个簇,也就是我们说的可重叠的聚类算法。思想:模糊K均值聚类并不是将对象分给最近的簇,而是计算向量和各个簇之间的相关性。假设有一个向量V,有K个簇,V和这K个簇的中心的距离是d1,d2,....,dkd_1,d_2,....,d_kd1​,d2​,....,dk​,则V到第一个簇的相关性U1=1d1d1U_1=\frac{1}{\frac {d...

2019-04-14 21:08:06 2998 1

原创 RBF核函数和Linera核函数关系

1.Linear核主要用于线性可分的情形。参数少,速度快,对于一般数据,分类效果已经很理想了。2. RBF核主要用于线性不可分的情形。参数多,分类结果非常依赖于参数。通过训练数据的交叉验证来寻找合适的参数,验证过程比较耗时。个人经验:使用libsvm,默认参数,RBF核比Linear核效果稍差。通过进行大量参数的尝试,一般能找到比linear核更好的效果。至于到底该采用哪种核,要根据具体...

2019-04-14 20:56:12 7076

原创 【美团机器学习实践】问题建模

机器学习解决问题的通用流程,主要分为4大部分:1.问题建模2.特征工程3.模型选择4.模型融合问题建模包含三部分:评估指标、样本选择、交叉验证1.1评估指标评估指标用于反映模型效果,预测问题中,将预测结果和真实结果进行比较,为:实际项目中,线下和线上的评估指标尽可能变化趋势保持一致,线上成本明显高于线下实验成本,在线上实验较长时间并对效果进行可信度检验(如t−testt-tes...

2019-04-14 08:49:28 390

Python 中DataFrame相关数据分析文档.pdf

使用python中的pandas库函数对dataframe的相关数据进行处理,是一个入门数据分析的好文档

2020-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除