自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 资源 (1)
  • 收藏
  • 关注

原创 力扣动态规划

首先看第一种情况,如果s【5】单独代表一个字母,那么就简单了,这时f【6】=f【5】,这点应该好理解,就是说我后面再加一个字母,不影响我的种数。第二种情况,就是s【4】和s【5】一起构成一个字母,那么之前的f【5】在此时就没有了意义,f【6】=f【4】,相当于f【4】后面加了一个字母。中间态写完之后考虑起始态,f【1】一定是1,但是f【1】=f【1】+f【0】;比如,f【5】就代表不管s有多少位,s的前5位一共有f【5】种解法,先记住这一点,这是思路的突破口。

2022-09-29 11:00:14 153 1

原创 STL学习笔记

STL

2022-09-05 10:29:52 255

原创 正则表达式

以前学习的时候把这一块跳过了,现在补上正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。runoo+b,可以匹配 runoob、runooob、runoooooob 等,+ 号代表前面的字符必须至少出现一次(1次或多次)。runoo*b,可以匹配 runob、runoob、runoooooob 等,*号代表前面的字符可以不出现,也可以出现一次或者多次(0次、或1次

2022-09-02 11:48:11 144

原创 试题 算法训练 无聊的逗

问题描述  逗志芃在干了很多事情后终于闲下来了,然后就陷入了深深的无聊中。不过他想到了一个游戏来使他更无聊。他拿出n个木棍,然后选出其中一些粘成一根长的,然后再选一些粘成另一个长的,他想知道在两根一样长的情况下长度最长是多少。输入格式  第一行一个数n,表示n个棍子。第二行n个数,每个数表示一根棍子的长度。输出格式  一个数,最大的长度。样例输入41 2 3 1样例输出3数据规模和约定  n<=15这道题暴力解决吧,我本人没啥思路,在网上找的一个大佬的#include&lt

2022-03-18 15:39:01 368 2

原创 蓝桥杯——算法训练(1,2,3)

1回形取数问题描述  回形取数就是沿矩阵的边取数,若当前方向上无数可取或已经取过,则左转90度。一开始位于矩阵左上角,方向向下。输入格式  输入第一行是两个不超过200的正整数m, n,表示矩阵的行和列。接下来m行每行n个整数,表示这个矩阵。输出格式  输出只有一行,共mn个数,为输入矩阵回形取数得到的结果。数之间用一个空格分隔,行末不要有多余的空格。  #include<iostream>#include<string>using namespace std;

2022-03-17 11:31:11 865

原创 opencv基操(截图了,懒得复制代码了)

就到这了,opencv3.2版本和4.3版本之间sift是有专利保护的,我的cv版本还没有调整好,先学到这了。。。

2021-11-16 09:06:43 1292

原创 opencv无法写入文件夹

今天遇到了opencv的一个函数imwrite()无法向文件夹里放图片了,无论怎么试都不行,后来百度了一下,原来文件夹不能是中文。。。。。我只能说以后干啥都用英文给电脑里面的各种东西命名把在这...

2021-10-06 20:20:10 219

原创 tensorflow2.0框架学习笔记(2)(复习一下基本的深度学习)

深度学习是机器学习的一小部分,上面是机器学习的流程,其中最重要的是特征工程对于传统算法来说,最难的一步就是提取特征了,因为对于特征的提取和优化,是人工决定的,显得不那么智能,可是对于深度学习来说,计算机会自己学习,决定哪些特征是计算机觉得最合适的。k近邻问题我们先不看这个knn,先把k近邻升级一下,将这种思想用在图像领域,我们使用cifar100数据库我们自己定义一个距离的选择公式,直接将图片对应的像素点的数据作差再最后求和,用这个数值来代表距离的远近(也就是图片的相似度)基于这.

2021-09-22 21:04:45 171

原创 tensorflow2.0学习笔记(1)

原文章在这Tensor 数据类型在介绍 Tensor 数据之前,先介绍两种 Python 常用的数据结构,并解释,为什么做深度学习不用这些数据结构,而是要用 Tensor。List : Python中最常用的数据结构,以 [ ] 括起来,如 [1, 1.1, ‘hello’, ‘(1,2)’, layers] ,缺点是储存图片占用内存非常大,读写图片数据效率低。np.array : 存成一个静态数组,转置、加减乘除等运算方便灵活,但 numpy 不提供创建张量函数和自动梯度求导,也不提供 GPU 支

2021-09-22 21:04:18 340

原创 #赛题1:用户情感可视化分析#

第一步,把库和数据导入import pandas as pddata = pd.read_csv('./earphone_sentiment.csv')data看一下情感词data['sentiment_word'].value_counts()快速浏览数据集data.info()既然要分析情感,那么我们肯定要考虑汉字情感词之间的关系,所以我们先导入库jieba或者这个为了数据可视化,词语太多,我们可以考虑使用词云展示,导入库worldcloudworldcloud导入PI

2021-09-10 10:04:25 460

原创 力扣刷题----噩梦开始的地方(我尽量每日一题)

1,两数之和class Solution(object): def twoSum(self, nums, target): """ :type nums: List[int] :type target: int :rtype: List[int] """ hashmap = {} for index, num in enumerate(nums): anothe

2021-07-31 17:43:18 106 1

原创 卷积神经网络

卷积神经网络主要是由输入层、卷积层、激活函数、池化层、全连接层、损失函数组成,表面看比较复杂,其实质就是特征提取以及决策推断。要使特征提取尽量准确,就需要将这些网络层结构进行组合,比如经典的卷积神经网络模型AlexNet:5个卷积层+3个池化层+3个连接层结构。卷积(convolution)卷积的作用就是提取特征,因为一次卷积可能提取的特征比较粗糙,所以多次卷积,以及层层纵深卷积,层层提取特征(千万要区别于多次卷积,因为每一层里含有多次卷积)。这里可能就有小伙伴问:为什么要进行层层纵深卷积,

2021-07-30 11:21:41 559 1

原创 lgb预测泰坦尼克

翻了一下csdn,发现没有用lgb模型处理泰坦尼克的,所以就去写了一下,代码里面注释点的部分是我为了解决报错的各种尝试,就不删除了,哈哈,代码拿走不谢import numpy as npimport pandas as pdimport lightgbm as lgbfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scoreimport matplotlib.pypl

2021-07-28 16:34:46 392 1

原创 阿里云——零基础入门语音识别——食物声音识别——代码跑通及解析

大佬代码在这我也是个垃圾,初学者练习这个项目,我认为第一步是熟悉这个平台的使用,这种云编程不同于pycharm,初学者可能会感觉十分别扭(比如垃圾的我),所以我在这个笔记里尽可能详细的说一下如何让大佬代码在自己的notebook里跑一边,只有知道了总体流程,才能写出属于自己的东西。强调一下,代码是大佬的,我们只是借鉴一下,所以想要有所进步,还需要自己的努力。零基础入门语音识别——食物声音识别打开我给的连接,会是这个样子![在这里插入图片描述](https://img-blog.csdnimg.cn

2021-07-28 16:31:12 2427 2

原创 lgb(lightgbm)处理类别特征遇到的问题(泰坦尼克):

lgb(lightgbm)处理类别特征遇到的问题:ValueError: DataFrame.dtypes for data must be int, float or bool. Didnot expect the data types in the following fields: Sex, Embarked加上这些代码,完美解决,记得点赞from sklearn import preprocessingencoder = preprocessing.LabelEncoder()enc

2021-07-20 09:56:17 3435

原创 python部分知识复习

python基本语法就不说了,现在开始复习python的4个容器列表lists列表其实就是Python中的数组,但是可以它可以动态的调整大小并且可以包含不同类型的元素:使用[,]直接创建列表,#将字符串转换成列表list1 = list("hello")print(list1)#将元组转换成列表tuple1 = ('Python', 'Java', 'C++', 'JavaScript')list2 = list(tuple1)print(list2)#将字典转换成列表dict1

2021-07-11 11:13:57 254

原创 LightGBM(LGB)

转载自littlemichelleLightGBM(Light Gradient Boosting Machine)是一个实现GBDT算法的框架,支持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点。背景常用的机器学习算法,例如神经网络等算法,都可以以mini-batch的方式训练,训练数据的大小不会受到内存限制。而GBDT在每一次迭代的时候,都需要遍历整个训练数据多次。如果把整个训练数据装进内存则会限制训练数据的大小;如果不装进内存,反复地

2021-05-28 20:45:17 1168 1

原创 决策边界(Logistic,sigmoid)

决策边界分类问题使用Logistic函数(也叫sigmoid函数),对于乳腺癌的分类问题,只要h(θTx)>=0.5,就令y=1,也就是说θTx>=0,否则令y=0,其中x是肿瘤大小,所以,给出训练集。假设,我们已经得到了θ=[-3,1,1]T,所以,当y=1时,-3+x1+x2>0,所以x1+x2<3,所以这条粉色的线就是决策边界,很好的解决了分类问题。增加难度,如图:很明显不能使用线性的决策边界来进行分类,所以我们增加了θ的维度,假定解得θ=[-1,0,0,1,1]

2021-05-28 16:13:16 799

原创 为什么不用线性回归解决分类问题

为什么不用线性回归解决分类问题笔记一如既往的来自吴恩达的视频举个例子就明白了经典的肿瘤问题:假设肿瘤良性恶性只与肿瘤的大小尺寸有关,那么,这就是一个简单的分类问题,如图如果我们使用线性回归解决问题的话,我们可以得到一个方程,y=θx+b,拟合出来的曲线如下:可以看到,我们拟合的很好,取分割的地方,就是图中小箭头标注的地方,你可能会认为这不就是用线性回归解决的吗?拟合的挺不错啊,其实这十分具有偶然性,例如,在这个训练集上,我再加一个数据最右面的那个点就是我们新加的数据,有一个患者的肿瘤

2021-05-28 11:01:54 470

原创 4种激活函数

4种激活函数1,sigmoid函数特点:1,输出值落于[0,1]连续区间;2,输入值从横坐标左侧移动到右侧的过程中,其输出值呈现从平缓到加速再到平缓的特点;3,sigmoid函数的导数值落于[0,0.25]的连续区间;注意:在神经网络中,sigmoid函数其实有很大的局限性,在逆向参数调整back propagation过程中,使用链式法则chain rule,可以推导出下面的公式:并对深度神经网络模型的权重调整幅度进行计算,中间是sigmoid函数导数的乘积,多个小于0.25的值相乘后,会

2021-05-27 12:15:42 723

原创 正规方程

区别与使用迭代的梯度下降法,正规方程可以一次性求出最有解(基本只需要一步),

2021-05-23 08:51:58 234

原创 2021-05-22

集成学习这样分类就很明确了随机森林要得到泛化性能强的集成,集成中的个体学习器应尽可能相互独立,虽然这在现实任务中很难做到,但我们可以设法使基学习器尽可能具有较大的差异。这样理解,对于一组数据,先设定n个组,然后有放回的随机抽取L个数据集,然后还要随机选取m个特征,放进第一个决策树(基学习器),这样便会得到一个决策结果,重复n遍,如果是回归就去均值,如果是分类问题就去取众数,类似于班内同学举手投票,少数服从多数。代码部分在整理GBDT先简单理解BDTGBDT代码部分:

2021-05-22 21:03:24 145

原创 支持向量机

1,SVM算法导入1.1,定义有时候,人们会把支持向量机称为大间距分类器。SVM全称support vector machine(支持向量机),即寻找到一个超平面使样本分成两类,并且间隔最大,1.2,超平面最大间隔介绍如图,三条线代表了三种可能的线性分类器的决策边界。虚线非常糟糕,其余两个模型在这个训练集上表现完美,但它们的决策边界与事例过于接近,导致在面对新事例时,表现可能不会太好。上图的这个实线代表SVM分类树的决策边界,不仅分离了两个类别,且尽可能远离最近的训练事例。1.3硬间隔和

2021-05-16 16:29:27 136

原创 2021-05-08

多功能:房价预测问题中,房价只与面积有关,可是这并不符合事实,房价的因素与许多因素有关,所以我们引入多功能。(会用到线代的基础知识)

2021-05-09 09:36:27 76

原创 2021-05-09

多元梯度下降法——特征缩放如果你有一个机器学习问题,这个问题有多个特征值,设想一下你的特征值分布,无疑当你的特征值分布特别广的时候,会严重影响你梯度下降收敛的速度,例如房价问题中,第一个特征值是房子面积(0~2000),第二个特征值是卧室数量(0 ~5),设想一下,这会让代价函数的平面图严重畸形,横向已经到了最优解的时候,纵向几乎还没开始下降,类似于下面这种:所以,为了速度问题,有特征缩放的方法。方法简单,就是用该特征值的每一个数除以最大的特征值,这样使得每个新特征值都能保持在(-1 ~1)之间。这

2021-05-09 09:25:26 110

原创 2021-05-05

了解了梯度下降的知识,不在代码上体现怎么可以呢?上代码,先看第一个,经典房价问题:# 导入需要用到的库import numpy as npimport matplotlib.pyplot as plt# 定义存储输入数据(x)和目标数据(y)的数组x, y = [], []# 遍历数据集,变量sample对应的正是一个个样本for sample in open("C:\\Users\\贺旭伟\\Desktop\\shujuji.txt.txt", 'r'): _x, _y = sa

2021-05-05 14:56:03 561

原创 2021-04-28

机器学习上一节,我们已经知道了什么是代价函数,这次,我们讲具体的用法:如图:左边是假设函数,右边是代价函数,暂且令纵截距为0,那么每一个斜率,都会产生一个代价函数上的一个值,然后我们对斜率重复取值,结果便会在代价函数的图中画许多的点,连接起来后,讲代价函数的图像画了出来,横坐标是斜率,如图:很明显,为了最拟合,便要让代价函数最小,从右图中看出斜率为1是最合适。...

2021-05-04 21:44:29 117

原创 2021-04-28

机器学习——模型描述(本篇文章能让你看到监督学习的过程是怎样的)先上数据集:了解即可我们的重点就是得到函数h的过程:一开始我们将进行一元函数(线性方程),因为简单。(我具体详细更新日期看情况吧,会一点点慢慢讲的,不急,哈哈)。机器学习——代价函数我们暂且认为某个训练集得到的是线性函数:那么,怎么确定两个未知数,(为了方便理解,我叫它斜率和纵截距,方便,懂?)预测值与实际值的平方的和越小,代表拟合越好,公式中的m代表样本容量,观察可知,实际用的公式除以了2m,因为用平均值的概念能更好

2021-04-28 19:24:56 54

原创 2021-04-28

机器学习1,监督学习从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。监督学习就是最常见的分类(注意和聚类区分)问题,通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优表示某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的。也就具有了对未知数据分类的能力。监督学习的目标往

2021-04-28 17:12:02 84

原创 机器学习——决策树

决策树的基本知识说明:这篇博客是看周志华老师的《机器学习》(西瓜书)的笔记总结,仅供学习交流,不做商业用途。借鉴未名湖畔的落叶借鉴致敬大神借鉴maershii决策树,顾名思义,是通过一个个的判断来形成一个类似于树状的结构,如图:好了,现在你已经对决策树有了基本的概念,然后我们接着介绍:熵:一种事务的不确定性。信息:用来消除不确定的事物。功能有三:调整概率,排除干扰,确定情况。怎么理解这两个东西呢:这就要用买西瓜(因为西瓜书,所以买西瓜)的例子了,你怎么知道你要买的西瓜是不是熟的

2021-04-27 22:21:05 112

原创 2021-04-22

决策树1.基础知识:决策树理解起来是很浅显易懂的一种分类算法,它从数据集中提取出一系列的规则。每一条达到叶节点的路径都是一条规则,用于决策所属类别。将特征作为树的非叶节点;分支是对应特征的每类属性值(已给每条数据都有属性值以及类别);叶节点是所属类别。如图:熵的计算:那么怎么选择具有决定性的特征呢?为了找到决定性特征,划分出最好的结果,我们必须评估每个特征。熵定义为信息的期望值,先看看信息的计算。如果 xi 类别被划分在含有x1,x2…xn 类的集合中(混合类), xi 的信息定义为如下:

2021-04-22 21:05:52 1377 2

c++课设111.zip

大一时写的c++课设,以后谁用的话拿去即可,有一个小bug,用vs2019的Ctrl+F5可以运行,就是执行不调试可以,调试不行,vs2019写的,记住装easyx库,项目属性调成多字节字符集。

2021-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除