- 博客(57)
- 收藏
- 关注
原创 自然语言处理-词向量模型-Word2Vec
如果一个语料库稍微大一些,可能的结果简直太多了,最后一层相当于softmax,计算起来十分耗时,有什么别的方法吗?如何来描述语言的特征呢,通常都在词的层面上构建特征,Word2Vec就是要把词转换成向量。在结果中可以发现,相似的词在特征表达中比较相似,也就是说词的特征是有意义的!通常数据的维度越高,能提供的信息也就越多,从而计算结果的可靠性就更值得信赖。假设现在已经拿到一份训练好的词向量,其中每一个词都表示为50维的向量。出发点非常好,但是此时训练集构建出来的标签全为1,无法进行较好的训练。
2023-09-08 20:48:30 839
原创 pytorch-构建卷积神经网络
当前epoch: 1 [12800/60000 (21%)] 损失: 0.120306 训练集准确率: 98.59% 测试集正确率: 98.97%当前epoch: 1 [25600/60000 (43%)] 损失: 0.068475 训练集准确率: 98.59% 测试集正确率: 98.87%当前epoch: 1 [51200/60000 (85%)] 损失: 0.009284 训练集准确率: 98.69% 测试集正确率: 98.97%
2023-09-06 22:47:19 1110 4
原创 pytorch-神经网络-手写数字分类任务
一般情况下,如果模型有可学习的参数,最好用nn.Module,其他情况nn.functional相对更简单一些。当前step:24 验证集损失:0.38733808159828187。当前step:10 验证集损失:0.7927186088562012。当前step:14 验证集损失:0.5643046331882476。当前step:15 验证集损失:0.5317994566917419。当前step:4 验证集损失:1.9517273582458496。
2023-09-06 22:15:15 737 1
原创 计算机网络自顶向下-web页面请求历程
Bob 便携机因此首先生成一个具有目的端口 80 (针对 HTTP 的)的 TCP SYN 报文段,将该 TCP 报文段放置在具有目的 IP 地址 64.233. 169. 105 (www. google. com) 的 IP 数据报中,将该数据报放置在 MAC 地址为 00:22:6B:45:1F: 1B (网关路由器)的帧中, 并向交换机发送该帧。网关路由器在通往学校网络的接口上接收到包含读 ARP 查询报文的帧,发现在 ARP 报文中目标 IP 地址匹配其接口的 IP 地址。
2023-09-05 15:07:06 528
原创 opencv-人脸识别
自备config.txt和haarcascade_frontalface_default.xml文件。config.txt 第一行写一个0即可。录脸的时候输入name.这哥们代码的一些修改。
2023-09-01 21:57:44 2320 1
原创 opencv运动目标检测-背景建模
由于场景中的目标在运动,目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧图像进行差分运算,不同帧对应的像素点相减,判断灰度差的绝对值,当绝对值超过一定阈值时,即可判断为运动目标,从而实现目标的检测功能。在测试阶段,对新来像素点的值与混合高斯模型中的每一个均值进行比较,如果其差值在2倍的方差之间的话,则认为是背景,否则认为是前景。将前景赋值为255,背景赋值为0。3.当后面来的像素值时,与前面已有的高斯的均值比较,如果该像素点的值与其模型均值差在3倍的方差内,则属于该分布,并对其进行参数更新。
2023-08-15 10:33:33 552 1
原创 opencv光流估计
空间一致:一个场景上邻近的点投影到图像上也是邻近点,且邻近点速度一致。因为光流法基本方程约束只有一个,而要求x,y方向的速度,有两个未知变量。小运动:随着时间的变化不会引起位置的剧烈变化,只有小运动情况下才能用前后帧之间单位位置变化引起的灰度变化去近似灰度对位置的偏导数。光流是空间运动物体在观测成像平面上的像素运动的“瞬时速度”,根据各个像素点的速度矢量特征,可以对图像进行动态分析,例如目标跟踪。status 特征点是否找到,找到的状态为1,未找到的状态为0。prevPts 待跟踪的特征点向量。
2023-08-15 10:08:35 315
原创 opencv直方图与模板匹配
模板匹配和卷积原理很像,模板在原图像上从原点开始滑动,计算模板与(图像被模板覆盖的地方)的差别程度,这个差别程度的计算方法在opencv里有6种,然后将每次计算的结果放入一个矩阵里,作为结果输出。假如原图形是AxB大小,而模板是axb大小,则输出结果的矩阵是(A-a+1)x(B-b+1)
2023-08-14 22:58:12 854
原创 opencv特征匹配
每一次拟合后,容差范围内都有对应的数据点数,找出数据点个数最多的情况,就是最终的拟合结果。如果需要更快速完成操作,可以尝试使用cv2.FlannBasedMatcher。选择初始样本点进行拟合,给定一个容忍范围,不断进行迭代。
2023-08-14 20:19:14 98
原创 opencv图像特征-sift(尺度不变特征转换)
旋转之后的主方向为中心取8x8的窗口,求每个像素的梯度幅值和方向,箭头方向代表梯度方向,长度代表梯度幅值,然后利用高斯窗口对其进行加权运算,最后在每个4x4的小块上绘制8个方向的梯度直方图,计算每个梯度方向的累加值,即可形成一个种子点,即每个特征的由4个种子点组成,每个种子点有8个方向的向量信息。这些候选关键点是DOG空间的局部极值点,而且这些极值点均为离散的点,精确定位极值点的一种方法是,对尺度空间DoG函数进行曲线拟合,计算其极值点,从而实现关键点的精确定位。opencv SIFT函数。
2023-08-14 20:11:15 93
转载 机器学习-线性回归和线性分类模型
本次实验简述了最小二乘法、最大似然估计、逻辑回归、正则化、验证和学习曲线的基本概念,搭建了基于逻辑回归的线性模型并进行正则化,通过分析 IBMD 数据集的二元分类问题和一个 XOR 问题阐述逻辑回归的优缺点。本次实验主要使用逻辑回归的方法构建线性回归和线性分类模型,正则化、验证曲线、学习曲线方法可以帮助我们更好更快的构建模型。
2023-07-27 16:34:39 718
转载 机器学习-决策树和K近邻分类(KNN)构建分类和回归模型
在深入本次实验之前,首先了解一下什么是机器学习, Machine Learning(T. Mitchell 著,1997 年出版)一书中给出了机器学习经典、通用的定义:假设用 P 来评估计算机程序在某任务类 T 上的性能,若一个程序利用经验 E 在任务 T 上获得了性能改善,则我们就说关于 T 和 P, 该程序对 E 进行了学习。在不同的问题设定下,T、P、E 可能指完全不同的东西。分类:基于特征将实例分为某一类。回归:基于实例的其他特征预测该实例的数值型目标特征。
2023-07-22 16:17:21 920
转载 机器学习-数据可视化分析与t-SNE降维
在机器学习领域中,可视化是十分重要的。在开始一项新任务时,通过可视化手段探索数据能更好地帮助人们把握数据的要点。在分析模型表现和模型报告的结果时,可视化能使分析显得更加生动鲜明。有时候,为了理解复杂的模型,我们还可以将高维空间映射为视觉上更直观的二维或三维图形。可视化是一个相对快捷的从数据中挖掘信息的手段。本文将使用 Pandas、Matplotlib、seaborn 等流行的库,带你上手可视化。
2023-07-21 18:32:16 311 1
原创 修改jupyter Notebook文件默认保存路径
右键jupyter Notebook快捷方式查看属性,目标–删除最后面的"%USERPROFILE%"找到c.NotebookAPP.notebook_dir 添加文件默认保存路径。打开jupyter_notebook_config.py。打开Anaconda prompt 输入命令。再次打开jupyter Notebook。
2023-07-21 14:50:43 136 1
原创 pandas人口收入普查数据探索
Adult 数据集是一个关于人口收入普查的数据集,其包含多个特征,目标值为类别类型。统计数据集中最长周工作小时数及对应的人数,并计算该群体中收入超过 50K 的比例。年收入超过 50K 和低于 50K 人群年龄的平均值和标准差是多少?统计男性高收入人群中已婚和未婚(包含离婚和分居)人群各自所占数量。计算各国超过和低于 50K 人群各自的平均周工作时长。年收入超过 50K 的人群是否都接受过高中以上教育?统计不同种族和性别人群的年龄分布数据。数据集中女性的平均年龄是多少?数据集中德国公民的比例是多少?
2023-07-21 14:10:23 182 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人