自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

happyhuidi的博客

Hello!程序媛

  • 博客(74)
  • 收藏
  • 关注

原创 每天学习一点shell系列(2)—函数的参数传递

传入的第10个参数不是200000,而是第1个参数和字符串'0'——‘dianshang.mdb.mig0’

2023-12-07 11:39:16 484

原创 【读书笔记】自然语言处理:基于预训练模型的方法(第1章)

第1章 绪论1.1 自然语言处理的概念自然语言处理(Natural Language Processing,NLP)主要研究用计算机理解和生成自然语言的各种理论和方法,属于人工智能领域的一个重要甚至核心分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学(Computational Linguistics,CL)。1.2 自然语言处理的难点1.3 自然语言处理任务体系1.3.1 任务层级按照从低层到高层的方式,可以划分为资源建设、基础任务、应用任务和应用系统四大类...

2021-11-02 21:16:14 630

原创 [正则表达式实践1] 使用正则表达式提取商品的数字属性

1. 需求背景商品名称或商品详情中往往直接包含了商品的数字特性,有时需要提取这些数字特性再进行下一步的处理,如:-----------------------------------------------------商品的价格,X1元X2元X3元商品的规格,10个装20个装50个装商品的长度,1米1.5米2米5米商品的尺寸,5cm10cm20厘米商品的功率, 10w15w20w25w----------------------------------------------

2021-10-11 17:55:51 494

转载 TensorFlow学习系列(1)——tf.nn.conv2d()函数详解

转自callinglove的【TensorFlow】conv2d函数参数解释以及padding理解,写得很棒。

2019-12-11 12:09:03 413

原创 word2vec——图解生成batch数据的code(for skip-gram模型)

skip-gram模型:使用中心词来预测上下文单词。1. 涉及到的三个重要输入参数:batch_size num_skip skip_window2.输入 参数之间的关系——两个必要条件batch_size % num_skips == 0(整除关系) num_skips <= 2 * skip_window3. 输出参数batch: 由双向队列bu...

2019-11-28 21:57:51 652

原创 python3学习系列(4)——List末尾添加新元素时append()与extend()的区别

append()方法: 用于在列表末尾添加新的对象。 由于列表可包含任何数据类型的元素,单个列表中的元素无须全为同一类型。 所以通过append()方法添加的新元素不一定跟原来的一样。 直接把新对象当作一个整体添加到末尾。 extend()方法: 用于在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)。 只接受一个新对象作为参数,并将该参数的每个元素都添...

2019-11-27 20:25:31 3584 1

转载 word2vec 中的数学原理和图解

本系列转自https://blog.csdn.net/peghoty/article/details/37969519,包括以下六个部分:(一)目录和前言(二)预备知识(三)背景知识(四)基于 Hierarchical Softmax 的模型(五)基于 Negative Sampling 的模型(六)若干源码细节...

2019-11-27 10:17:23 161

原创 TensorFlow基础(1)——数据的输入

TensorFlow客户端以三种方式接收数据:使用占位符placeholder,用python代码在算法的每个步骤中提供数据。 将数据预加载并存储为TensorFlow的张量 搭建输入管道例:代码: 1 #!/usr/bin/env python 2 # encoding: utf-8 3 import tensorflow as tf 4 import nump...

2019-11-20 17:24:05 244

原创 Linux环境下中文乱码问题

参考链接:Linux终端中文显示乱码解决之前:解决:在用户主目录下修改(或者新建)vim ~/.vimrcset fencs=utf-8,ucs-bom,shift-jis,gb18030,gbk,gb2312,cp936set termencoding=utf-8set encoding=utf-8set fileencodings=ucs-bom,utf...

2019-10-31 20:50:17 454

原创 Excel操作系列(2)—— Excel打开CSV乱码问题

问题描述在使用Excel打开csv文件时,发现中文字符乱码了!!原因分析Excel打开文件默认是ANSI,所以如果CSV文件的编码方式为utf-8的话打开就会乱码。解决方法首先,使用记事本打开乱码的csv文件 其次,把文件另存为,并选择编码格式为ANSI,如下图所示...

2019-10-31 20:31:55 235

原创 Python3学习系列(3)——为什么看着对齐的代码总提示未对齐?

问题描述''IndentationError: unindent does not match any outer indentation level''千辛万苦写好了一个程序,满怀期待想拉出去遛遛,就在你等着见证奇迹的时刻,突然提示你代码块未对齐,打开程序睁大眼睛检查了一遍又一遍还是觉得对齐了鸭?到底是哪里出了幺蛾子呢?原因分析python靠缩进(Indentatio...

2019-10-31 20:15:29 823

原创 Federated Learning(上)——联邦学习资料汇总

1.联邦学习/联盟学习 (Federated Learning) 的发展现状及前景如何?2.各位大佬觉得联邦学习可以研究的问题有些什么 小白了解一下这个水深不深?3.没有领域和算法限制,联邦学习是打破数据孤岛的利器4.【科普】数据不出本地,AI更强力?这一篇告诉你啥是联邦学习5.AI与数据隐私保护:“联邦学习”的破解之道6.联邦学习Inside: 蚂蚁金服共享...

2019-10-22 21:03:37 3103

原创 正则表达式系列(1)——去除括号(或其他符号)及其包含的内容

1. 去除括号及其包含的内容表达式:\(.*\)用例测试1:2.去除其他符号及其包含的内容:把()对应的位置换成其他符号,用到特殊字符时,必须进行转义,非特殊字符可以不转义。表达式:\[.*\]用例测试2:表达式:\{.*\]}用例测试3:用例测试4:用例测试5:【】,可以不用转义用例测试6:《》,可以不用转义...

2019-10-21 11:00:59 14814 1

原创 VIM系列(1)——常用操作(上)

1.撤销与恢复撤销撤销:Esc命令下+u(小写) 恢复撤销:Esc命令下+Ctrl+r2. 全选、复制、剪切、粘贴全部操作:全部复制:Esc命令下+ggyG 全部删除:Esc命令下+dG 全选高亮显示:Esc命令下+ggvG或者ggVG复制:复制一行:Esc命令下+yy 复制多行:将第9行至第15行的数据,复制到第16行,Esc命令下+:9,15 cop...

2019-10-18 21:40:51 189

原创 VIM系列(2)——VIM操作的四种模式

VIM常用模式包括以下四个模式:正常模式(normal-mode) 插入模式(insert-mode) 可视模式(visual-mode) 命令模式(command-mode)1. 正常模式(normal-mode)正常模式主要用来浏览和修改文本内容的,一般的,打开Vim都是正常模式。在任何模式下,只要按下 Esc 键就可以返回正常模式。2. 插入模式(inse...

2019-10-18 21:12:14 381

原创 每天学习一点MySQL系列(6)——正则表达式

正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较。1. 基本的字符匹配regexp后面所跟的内容作为正则表达式。 '.'是正则表达式中一个特殊的字符,表示匹配任意一个字符,注意:只是一个。 匹配不区分大小写,如果需要区分,需要使用binary关键字。select column1 from TABLE where column2 regexp '9...

2019-10-17 12:58:25 138

转载 Excel操作系列(1)——合并多单元格内容

【为什么要创建该专栏?】以前会觉得在简历上写上【熟练掌握excel】是一件low爆表的事情~为什么呢?因为愚昧无知~excel真的拥有非常强大的功能,只是自己没有领会到它的精髓所在~为了弥补无知,现把工作学习中遇到的excel的功能总结一下~---------------------------------------------------------知识贫穷的分割线...

2019-10-16 15:05:51 397

转载 Python3学习系列(2)—— re模块中的findall()和compile()方法

1. findall()re.findall()在字符串中找到正则表达式所匹配的所有子串,并返回一个列表;如果没有找到匹配的,则返回空列表。返回结果是列表类型,需要遍历一下才能依次获取每组内容。findall(patern, string, flags=0)pattern : 正则中的模式字符串。 string : 要被查找替换的原始字符串。 flags : 标志位,用于控制...

2019-10-12 15:57:46 1369

转载 Python3学习系列(1)——函数中self参数的作用

声明:本篇博客转自Python类中的self到底是干啥的,如有侵权,请联系作者删除!Python编写类的时候,每个函数参数第一个参数都是self,一开始我不管它到底是干嘛的,只知道必须要写上。后来对Python渐渐熟悉了一点,再回头看self的概念,似乎有点弄明白了。何时使用self?self只有在类的方法中才会有,独立的函数或方法是不必带有self的。self在定义类的方法时是必...

2019-10-12 11:44:25 3274

原创 每天学习一点MySQL系列(5)— 根据表中的某个字段删除重复的数据,只保留一个

应用场景: 数据表具有多个字段,其中某个字段的值重复了,比如针对一个商品数据,商品对应的网址链接可能重复,但是其他字段不一样,此时我们只需要保留一个url即可,也即保留一整条数据,删除其他的。 注意事项: 中间的查询结果必须使用临时变量保存在一个表格中,因为不能把在同一表中查询的数据作为同一表的更新数据! --假设根据字段‘url’来删除重复的值,只保留id最小的一个--把...

2019-10-10 19:30:29 282

原创 每天学习一点MySQL系列(4)— 在select语句中使用变量

有时候需要在python环境下访问数据库,此时查询语句select中可能会使用不同的变量进行数据查询。使用方法:在select语句中用{}来代替变量,并且用.format(var1, var2, var3)last_time = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time() - 3600*24*1))...

2019-10-09 22:14:28 1871 1

原创 每天学习一点MySQL系列(1)— 插入、更新、删除、统计

1. 插入——insert or replaceinsert into Table(字段1, 字段2, ......字段n) values(%S,%s, ...%d) (value1, value2, valuen)replace into Table(字段1, 字段2, ......字段n) values(%S,%s, ...%d) (value1, value2, valuen)2...

2019-10-09 13:21:04 103

原创 每天学习一点MySQL系列(3)— order by、desc、asc、where、is null、like

1)order by--以字母顺序排序数据,默认是升序select column1 from table order by column1;--按照多个列进行排序select column1, column2, column3, column4 from table order by column1, column2;2)descdesc关键字只应用到直接位于它前面的列名;...

2019-10-09 13:19:54 1095

原创 每天学习一点MySQL系列(2)— use、show、describe、help、select、distinct、limit

1)use--选择数据库use database2)showshow databases;show tables;--更多关于show的命令help show;3)describedescribe table;--等价于show columns from table;4)help5)select--检索单个列select column1 fr...

2019-10-09 13:19:22 330

翻译 论文解读—Locality Preserving Projections(LPP)

0. 摘要1. LPP的基本思想LPP是一种线性降维算法,其基本思想是:1)首先构建了一个融合了数据邻域信息的图;2)然后根据图的拉普拉斯的概念,可以计算一个变换矩阵;3)最后通过该变换矩阵把数据映射到子空间。在某种程度上,该变换最优地保留了局部邻域信息。通过该算法得到的表示map可视为:对一个连续的map(来自流形几何)的线性离散逼近。2. LPP的特点...

2019-08-21 16:43:49 797

翻译 论文解读——deep learning in remote sensing

1. motivation2. 从感知机到深度学习感知机是早期神经网络的基础,是一种受生物启发的e分类模型,用于2.1 自动编码模型2.1.1 自编码和堆自编码2.1.2 稀疏自编码2.1.3 RBM和DBN2.2 CNN2.2.1 AlexNet2.2.2 VGGNet2.2.3 ResNet2.2.4 FCN3. 当遥感遇到深度学习3.1 ...

2019-08-21 16:43:30 413

翻译 迁移学习

原文链接:http://cs231n.github.io/transfer-learning/1.迁移学习方案在实践中,很少有人从头开始(随机初始化)训练整个卷积网络,因为拥有足够大小的数据集是相对罕见的。 相反,通常在一个非常大的数据集(例如ImageNet,其包含具有1000个类别的120万张图像)上预先训练ConvNet,然后使用ConvNet作为感兴趣的任务的初始化模型或固定特征提...

2019-08-21 16:42:50 77

翻译 论文解读——High-Resolution PolSAR Scene Classification With Pretrained Deep Convnets

原文:'High-Resolution PolSAR Scene Classification With Pretrained Deep Convnets and Manifold Polarimetric Parameters'.摘要:在PolSAR数据分析中,如何联合使用空间和极化信息一直以来都是一个开放的话题。受益于先进的结构和大规模可视化数据集,深度卷积神经网路能够生成高层空间特征,在...

2019-08-21 16:41:58 217

翻译 论文解读——A Novel Deep Fully Convolutional Network for PolSAR Image Classification

原文:A Novel Deep Fully Convolutional Network for PolSAR Image Classification摘要:提出滑窗全卷积神经网络和稀疏编码用于PolSAR图像分类。所提出的方法具有两个优点:(1)与CNN相比,避免重复的计算和内存消耗;(2)稀疏编码用来减少计算和存储消耗,同时在最大程度上保持图像的完整性;Introduction...

2019-08-21 16:41:24 191

转载 C/C++语言中的#和##的作用

作者:DanDan_M原文:https://blog.csdn.net/michaelhit/article/details/82853634经常遇到C/C++宏定义中的#,#的用法分为两种:#和##1)#表示将宏定义中的参数变成字符串2)##表示将宏定义中的参数变成字符串连在一起例1:#include &lt;iostream&gt;#define STR(...

2019-03-07 15:47:02 817

原创 实用小工具总结

1. 证件照类1)使用AI抠图软件去除背景:https://www.remove.bg/,(抠图非常精细),选择其中的高清无背景格式保存。2)使用PS新建图层,填充自己想要的颜色,把1)中抠出来的前景覆盖上即可得到。...

2019-03-07 10:22:07 236

原创 C++ Primer(07 章)— 类

1. 成员访问运算符1)点运算符:获取类对象的一个成员,使用点运算符访问一个成员函数时候,相当于调用该函数。2)箭头运算符:把解引用和成员访问两个操作结合在一起,it-&gt;item等价于(*it).item。2. 隐式参数this1)成员函数通过额外的this来访问调用它的对象。当通过一个对象来访问(调用)一个成员函数时,用该对象的地址来初始化this。2)this的目的总...

2019-02-19 11:41:23 82

原创 C++ Primer(06 章)— 函数

1. 函数基础1) 函数重载:即同一个名字对应多个不同的函数。2) 函数返回类型:不能是数组类型或者函数类型,但是可以是指向数组或函数的指针。3)局部变量:形参和函数体内部定义的变量统称为局部变量。4)自动对象:只存在于块执行期间的对象,如形参。5)局部静态对象:在程序的执行路径第一次经过对象定义语句时初始化,直到程序终止才销毁。6)函数的声明:也称为函数原型,函数可以声明...

2018-11-20 20:14:26 89

原创 从图嵌入视觉看子空间学习

1.流形学习以下介绍三种常见的流形学习方法,他们的共同点在于:1)都把数据最本质的结构信息编码在一个图的权值矩阵中;2)优化问题的求解都可以转化为相似的特征值分解问题。1.1 局部线性嵌入(LLE)LLE的基本思想:数据点可能分布于一个非线性的的子流形上,但是每一个局部的邻域可能是线性的这种假设是合理的。所以可以通过线性的系数和相邻的patch来描述和重建每一个patch的局部...

2018-10-31 21:12:25 2505

原创 降维 (Dimensionality Reduction, DR)

降维在机器学习、数据挖掘、信息检索、模式识别等信息处理的许多领域具有重要作用。在监督的机器学习中, 如果在预测输出的时候有许多不必要的特征,会使得算法的性能下降。在机器学习、计算机视觉、模式识别等领域,一个很重要的问题是如何提取少数量的特征。对此,一种常用的解决方式是使用降维技术。1. 已有降维方法分类  1)线性的:以PCA为代表, 缺点:要求数据嵌入在一个线性的空间。  2)非线性...

2018-10-31 19:41:57 667

原创 剑指offer 52. 两个链表的第一个公共结点

1.问题描述输入两个链表,找出它们的第一个公共结点。说明:应该是两个单向链表,成Y字型,不会成X型,也不会成环。2.解决思路链表只能从表头单向访问,可以利用栈的后进先出特性来实现,把两个链表压入栈再弹出来,但是那样需要两个辅助栈,如果两条链表的长度分别是m和n,则需要m+n个辅助栈空间,同时时间复杂度为O(m+n)。使用两个指针:先遍历计算链表的长度,让长链表的指针先走| m-...

2018-09-17 11:04:29 196

原创 剑指offer 23. 链表中环的入口

1.问题描述给一个链表,若其中包含环,请找出该链表的环的入口结点,否则,输出null。2.解决思路2.1 思路11)先判断链表是否有环;2)如果有环,假设环里面有n个结点,除去环之外有m个结点,使用快慢指针fast和slow,开始都指向头结点head,每次移动一个结点:    设fast指针先走x了步,我们希望slow指针从1结点经过m步到达第m+1个结点(即环入口)的时候...

2018-09-16 23:37:02 107

原创 剑指offer 25. 合并两个排序的链表

1.问题描述输入两个单调递增的链表,输出两个链表合成后的链表,当然我们需要合成后的链表满足单调不减规则。2.解决思路1)非递归的方法    如果可以改变链表,直接从头结点开始依次移动比较两个链表当前值的大小,把较小的值作为当前结点的下一个结点。   注意:刚刚开始的时候不知道头结点到底是1的还是2的,所以新建一个额外的新节点作为辅助:   ListNode *first =...

2018-09-16 21:37:11 87

原创 剑指offer 22. 链表中倒数第k个结点

1.问题描述输入一个链表,输出该链表中倒数第k个结点。2.解决思路由于链表只能从头结点开始遍历,所以我们需要知道链表总共有多少个结点,需要遍历一次知道长度n;1)使用一个指针,遍历链表两次:    第一次:遍历一次得到链表的长度n;    第二次:需要打印出倒数第k个,也就是正数的第n-k+1个;2)使用两个指针,遍历链表一次:    第一个指针node1:先走x步...

2018-09-14 17:18:09 116

原创 剑指offer 附加1. 删除链表中的重复结点

1.问题描述在一个排序的链表中,存在重复的结点,请删除该链表中重复的结点,重复的结点不保留,返回链表头指针。 例如,链表1-&gt;2-&gt;3-&gt;3-&gt;4-&gt;4-&gt;5 处理后为 1-&gt;2-&gt;5.2.解决思路1)链表为空,无重复;2)链表只有一个结点,不存在重复;3)链表有2个以上结点:考虑头结点是否会被删除的特例  a)为了防止头结点...

2018-09-14 15:46:19 106

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除