自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 百度图像主题爬虫代码

【代码】百度图像主题爬虫代码。

2023-11-20 18:16:04 776

原创 基于自编码器的k-means聚类

【代码】基于自编码器的k-means聚类。

2023-11-20 18:14:50 146

原创 基于Pytorch的自定义图像数据集类

【代码】基于Pytorch的自定义图像数据集类。

2023-11-20 18:14:00 59

原创 从自编码器得到图像隐编码

【代码】从自编码器得到图像隐编码。

2023-11-20 18:12:11 47

原创 基于VGGBN的自编码器

【代码】基于VGGBN的自编码器。

2023-11-20 18:10:59 32

原创 torchvision.transforms

【代码】torchvision.transforms。

2023-11-20 18:05:39 15

原创 Patch Embedding

咋眼看说去像是用大卷积核操作, 实际上只是借用它的方式, 最后在图像长宽维展平为一位再和第768个patch维对调实现了图像embedding , 秒啊~~3的图像达成196个patch,每个patch的size为768 ,即768维一维张量.对应196sentence, 每个sentence的编码映射为768维的特征向量。

2023-03-25 15:07:57 2043 1

原创 按键控制硬件端口状态按顺序单位转移

硬件端口为8个端口,可以改变端口状态的数量。延时函数定义按照12mHZcpu定义。

2022-12-09 13:19:54 138

原创 玩转51单片机

先了解下单片机原理VCC 正极 高电平GND 负极 低电平TXD 发送数据 Transmit(tx) Data 简写形式 串口通讯RXD 接受数据 Receive(rx) Data 简写形式 串口通讯注意在单片机中:数据终端设备DTE和数据通讯设备DCE反接,即TXD接RXD (More Detail)单片机可简单理解为一款微型计算机,在型号上具有多种型号选择,图示为STC89C52单片机,STC公司下的一款51单片机,51单片机为单片机的统称哦。结构上由电源、存储器(随机存储器RAM和只

2022-12-07 23:18:51 1334

原创 c语言小结

内存是存储器,为了更好使用内存将内存划分为小内存单元,每个内存单元的大小是一个字节。为了更好访问每个单元就给内存单元进行编号,即内存单元地址。static 修饰局部变量,让局部变量直到程序结束生命周期才结束。指针变量的大小取决于地址的大小。32平台32bit,4个字节。64平台64bit,8个字节。一般地,定义声明一个值所具备的属性可以归纳为变量还是常量。常量定义完不可修改,变量相反。字符串结束标志是\0的转义字符,转义字符部分不计入字符串内容。每个类型变量或常量都是存储在内存单元中。

2022-11-25 12:04:41 418

原创 2021-11-06:hash不可逆,img文件和xml文件重命名问题

import osimport xml.etree.ElementTree as ETdef rename(path, s): dir = os.path.join(path, s) files = os.listdir(dir) for i in files: if i.endswith('xml'): i_path = os.path.join(dir, i) tree = ET.parse(i_path)

2021-11-06 13:29:28 153

原创 python获取文件夹下所有指定文件地址(地址包括子文件夹下的文件地址)

import ospath = os.getcwd()for root, dir, filename in os.walk(path): # print(root) # print(dir) # print(filename) for i in filename: while i.endswith('.'):#指定要寻找的文件条件 print(os.path.abspath(i))bug:遍历停不下来,但可以遍历所有。...

2021-11-06 10:11:38 635

原创 6.算法编程练习:词频统计(1)

文章目录1. 题目2. 分析3. 代码4. 小结致谢1. 题目从data.txt文件读入一篇文章《从清华到MIT》,用 jieba 库的函数 lcut 的全模式做分词,统计词汇长度为 2 的词出现的次数,输出出现次数最多的前 10 个词汇及其出现次数。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬2. 分析读入,分词,定义一个字典存次长为2的词并将出现的频数统计为字典的关键字值,然后排序

2021-10-22 07:58:36 705

原创 python对文件的解压缩操作模块:zipfile

import osimport zipfile#这节主要总结这个模块。os模块其他节已经总结过dir_files = os.listdir()#传入一个path,得到当前文件夹下的所有目录名称with zipfile.ZipFile('myzipfile.zip', 'a') as zipfileobj:#调用模块的ZipFile()方法,传入压缩包名称和操作mode,这里mode=’a‘,对压缩包进行写入 for file in dir_files:#也可以根据需求压缩对应文件,if file.

2021-09-04 12:16:55 136

原创 python的临时文件操作

tempfile在python中,使用该模块进行临时文件的创建和改写。以下通过代码去学习这个模块的简要功能。from tempfile import TemporaryDirectory, TemporaryFile#这里的名字需要理解其结构好记忆一点。一般包都是取小写字母。类会涉及到首字母大写,英文名临时文件夹和临时文件with TemporaryDirectory() as tmp_dir:#叫什么可以根据习惯,这里已经完成了临时文件夹的创建with TemporaryFile(mode='w

2021-09-04 11:53:27 433

原创 python 文件和目录整理os模块

os.chdir('path')#在日常写代码过程中,首先,需要确定当前的工作目录。此时需要用到os.getcwd('path')#get current work directory,即获取当前工作目录os.listdir('path')#返回当前目录下的文件夹及文件构成的列表os.walk('path')#获取每一层文件夹下的文件路径、文件夹列表、文件列表#这个建议尝试运行下,这样才清楚具体指哪样。解释下==walk(‘’)==参数传入应该是当前工作目录下的一个目录,是一个字符串类型。os

2021-09-04 11:34:10 107

原创 python如何将字符串拆分为字母

list('text')#ortuple('text')#or','.join('text')

2021-08-20 16:38:56 3363

原创 5. 算法编程练习:Find the unique number

Find the unique numberInstructionsThere is an array with some numbers. All numbers are equal except for one. Try to find it!find_uniq([ 1, 1, 1, 2, 1, 1 ]) == 2find_uniq([ 0, 0, 0.55, 0, 0 ]) == 0.55Sample Teststry:import codewars_test as testexce

2021-08-19 19:13:10 133

原创 4. 算法编程练习:Highest Scoring Word

Highest Scoring WordGiven a string of words, you need to find the highest scoring word.Each letter of a word scores points according to its position in the alphabet: a = 1, b = 2, c = 3 etc.You need to return the highest scoring word as a string.If two

2021-08-14 20:44:36 214

原创 GitHub社区和git工具命令使用

文章目录GitHub社区和git工具配置用户名和邮箱本地打开GitBash,执行常用命令对仓库文件进行操作链接到GitHub,同步更新GitHub社区和git工具GitHub类似一个代码管理和交流的平台,git是管理代码版本的重要工具。git的存在意义是对于开发项目过程中需要多人协作完成,类似于当下的协作办公,可以一起编辑(需要授权),一起完成一个大的项目的各个模块最终汇总,完成了分布式存储和操作代码的功能。git是一个管理系统,也是一个小型的软件,在本地下载安装打开,界面为命令栏窗口。在窗口内输入相

2021-08-14 17:06:49 107

原创 2.特征工程:如何剔除“无效”特征

回顾上节内容特征工程就是数据加工,数据加工的本质从统计的角度看是还原真实,找到真实分布率。从机器学习角度看是在此基础上是之更加符合模型。需要先对对数据错误值(在不可改变数据源的情况下,基于现实近似于异常值(又包括了空缺值)),*但注意:异常值不一定是错误值,空缺值不一定是异常值。*需要理解,但在实际使用过程中考虑较少。至于原因由于已经在上节叙述了所以在此不做赘述。剔除特征背后的逻辑——相关性分析相对无效特征的剔除,用什么方法解决?在这之前需要先对原理进行考虑。剔除无效特征,是针对于模型预测结果来

2021-08-14 12:53:11 2924

原创 3. 算法编程练习:Find the odd int

Find the odd intGiven an array of integers, find the one that appears an odd number of times.There will always be only one integer that appears an odd number of times.Exampletest.assert_equals(find_it([20,1,-1,2,-2,3,3,5,5,1,2,4,20,4,-1,-2,5]), 5)test

2021-08-11 00:10:37 282

原创 1. 特征工程:原理及框架

特征工程内涵对于特征工程的理解,无需对此进行严格的划分,因为依据不同的标准,各个领域都会有不同。只需要知道,类似于对数据进行加工的都是特征工程,这个概念本身也不重要,不必深究。总之,特征工程就是数据加工加工数据原理和方法如何加工数据是重点。首先要明确我们做数据加工,目的是什么?事实上,根据不同的业务和问题需求,我们用到的方法是不同的,可是遵循的原理确实一致的,那就是还原真实。通常我们在现实生活中如何还原真实,根据以前的案例?这只是表象,其实根据的是统计学原理,这是大数定理所决定的当然还有其他著名

2021-08-10 22:46:32 388

原创 2. 算法编程练习:Give me a Diamond

Give me a DiamondJamie is a programmer, and James’ girlfriend. She likes diamonds, and wants a diamond string from James. Since James doesn’t know how to make this happen, he needs your help.TaskYou need to return a string that looks like a diamond shap

2021-08-09 17:20:35 195

原创 2. 数据结构-逻辑结构-线性表

前提知识回顾和关联有了数据结构基本知识,数据结构是数据对象的逻辑结构+存储结构+运算(增删改查)。逻辑结构有集合、线性结构、树结构、图或网状结构。显然线性表是数据逻辑结构的线性结构。它按照循序存储和链式存储(仅仅是分类标准,别混淆之前物理存储的概念)分为顺序表和链式表,链式表主要有单链表、双链表、循环链表、静态链表。顺序表地址连续的存储单元存储元素的表。由一个一维数组和一个序列长度构成。顺序表是一个数据结构,数据结构三元组是逻辑结构、存储结构、运算。它的逻辑结构就是线性结构,它的存储结构是顺序存

2021-08-09 10:22:04 758

原创 1. 数据结构基本概念

数据结构基本概念数据(不重要)所有能被输入进计算机并处理的符号总称数据元素数据的基本单位数据项数据元素的最小单位数据对象性质相同的数据元素集合数据类型数据的性质和对应在数据集上的操作总称抽象数据类型数据对象+数据关系+基本操作(比数据类型多了一个数据关系,抽象概念)数据结构逻辑结构+存储结构+运算 = 一种数据元素的组织形式逻辑结构集合结构(无序)、线性结构(一对一)、树形结构(一对多)、图和网结构(多对多)按是否是线性关系分为线性结构和非线性结构。线性结构有:线性

2021-08-09 09:03:16 79

原创 1. 算法编程练习:persistence(39) # returns 3, because 3*9=27, 2*7=14, 1*4=4 # and 4 has only one dig

ContentsProblem description:For example:Code:ConcludingProblem description:Write a function, persistence, that takes in a positive parameter num and returns its multiplicative persistence, which is the number of times you must multiply the digits in num

2021-08-08 12:16:32 132

原创 LaTex:中文宏包ctex,设置字体族、系列、形状

LaTex:中文宏包ctex,设置字体族、系列、形状\documentclass[12pt]{article}\usepackage{ctex}%标题区\title{text}\author{names}\date{2021.8.4}%正文区\begin{document}\maketitle你好,Hello latex$F(X)$$$f(X)$$%字体族设置(罗马字体,无衬线字体,打字机字体)\rmfamily Roma Family\sffamily Sans Ser

2021-08-08 10:37:46 7163 1

原创 ID3、C4.5、CART、GBDT、XGBoost、RF、AdaBoost等模型原理及联系

DT、CART、GBDT、XGBoost、RF、AdaBoostContentsDT、CART、GBDT、XGBoost、RF、AdaBoost联系决策树 (decision tree, DT)分类与回归树 (classification and regression tree, CART)梯度提升决策树 (gradient boost decision tree, GBDT)极致版梯度提升决策树 (extreme gradient boost, XGBoost)随机森林 (random forest,

2021-08-07 22:55:05 136

原创 统计机器学习原理

机器学习原理内涵机器学习就是让计算机不再只会通过命令执行任务。过程定义解决问题的一套方法。简单来说叫做算法,复杂来说叫做模型。通常,机器学习方法都是复杂模型,即使是最简单的一元线性回归都是有很多个算法结构组成,所以机器学习第一步是构建模型。已经明白其实模型就是更大规模的算法。这一步骤虽然是传统计算机能做的但是唯一不同的是,它打破了之前的瓶颈,有了自学习的性质。所以模型本质依然是算法。如何理解这句话?也就是说机器学习模型学习的是它自身模型的参数。所以,目标就明确了,那就是要找到一系列模型参数的一

2021-08-05 08:59:13 301

原创 python字符串的三种格式化方式:%s和%d、{}.format()、f‘{}‘

python字符串的三种格式化方式:%s和%d、{}.format()、f’{}’文章目录python字符串的三种格式化方式:%s和%d、{}.format()、f'{}'Thanks for reading字符串格式化,就是字符串中含有变量,根据需求地取出。比如,你给所有员工发邮件过程中,“你好,张三:”,那个张三可以是李四,也可以是王五等。对文本相应位置进行变量替换,叫做文本(字符串)格式化。三种形式:%s和%d{}.format()f’{}’形式1举例:names = ['张三'

2021-08-05 07:40:07 1254

原创 Markdown 和 Latex文本编译语言的联系和使用

Markdown 和 Latex文本编译语言的联系和使用文章目录Markdown 和 Latex文本编译语言的联系和使用内涵异同意义1. 相比window的word和notepad更加具有普适性2. 工欲善其事必先利其器Markdown和Latex使用方法Markdown基本操作进阶操作Latex基本操作内涵Markdown是一种轻量级标记语言,创始人为约翰·格鲁伯(英语:John Gruber)。 它允许人们使用易读易写的纯文本格式编写文档,然后转换成有效的XHTML(或者HTML)文档。这种

2021-08-04 21:54:36 902 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除