自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(388)
  • 资源 (3)
  • 问答 (2)
  • 收藏
  • 关注

原创 【自然语言处理】P1 自然语言处理概述

自然语言指的是人类的语言,如中文、英语等,处理特指使用计算机技术处理,所以自然语言处理(NLP)就是指使用计算机处理人类的语言。自然语言处理属语言学、计算机科学、信息工程和人工智能的交叉领域,涉及的内容非常广泛。人类的语言本身是复杂的,所以自然语言处理的任务也是多种多样的。

2025-01-14 16:01:02 1263

原创 【机器学习】P1 机器学习绪论

机器学习引言

2025-01-14 11:19:44 206

原创 【Docker】必知概念与常用命令

docker 镜像、容器与仓库的概念与关系,docker 常用命令一览

2024-09-19 15:59:16 592

原创 【Docker】安装全流程与配置完整镜像源(可安装 nginx)

docker 常用命令,安装完整流程,配置全镜像源

2024-09-19 10:01:20 801

原创 【大模型基础】P2 Bag-of-Words

词袋模型的概述和实例

2024-09-07 16:23:49 696

原创 【大模型基础】P1 N-Gram

N-Gram 模型是如何生成一段话的

2024-09-07 14:39:47 763

原创 【大模型基础】P0 大模型之路 —— 窗外灯火阑珊

大模型常识知识

2024-09-06 18:43:26 942

原创 【深度学习】P1 深度学习数据结构

深度学习的数据结构——张量的概念与其基本操作

2024-08-07 13:21:25 982

原创 【Python Cookbook】S03E07 处理无穷大以及NaN

中并没有开启这个功能,且模块需要与平台高度相关结合,只针对专家级的程序员使用。中没有特殊的语法直接表示这些特殊的浮点数值。但是我们可以通过用浮点数。有时候,高级程序员希望能够在出现无穷大或者。会通过所有的操作进行传播,且不会引发任何异常。如果我们需要对浮点数的无穷大、负无穷以及。模块可以用来调整这个行为,但是在标准的。而检测是否出现这些值,可以通过使用。而正是因为这样,唯一安全检测。的行为,让它能够抛出异常值。中表示无穷大、负无穷以及。进行判断测试,该怎么做?

2024-07-17 20:00:00 274

原创 【Python Cookbook】S03E06 复数运算 .real .imag 等

在标准数学函数模型情况下,不会产生复数值。也不会突然意外的出现的结果中。如果要对复数执行一些复杂的数学操作,比如计算正弦、余弦或者平方根,可以使用。很多问题虽然小众,但是我们的确需要使用复数来计算解决。认证方案交互时遇到了奇点问题,而唯一的解决方案就是在复平面解决问题。复数常用的指定方式有三种,第一种是直接通过后缀。但是如果我们希望产出复数的结果,那么先通过。模块声明我们要使用复数。

2024-07-17 09:09:14 616

原创 【Python Cookbook】S03E05 从字节串中打包和解包大整数 int.from_bytes() 以及x.to_bytes()

字节串与大整数之间的转换,int.from_bytes() 以及 x.to_bytes()

2024-07-11 19:00:00 982 1

原创 【Python Cookbook】S03E04 同二进制、八进制和十六进制打交道 0b 0o 0x

二进制 0b八进制 0o十六进制 0x

2024-07-11 11:08:51 411

原创 【Python Cookbook】S03E03 对数值做格式化输出 format()

如果需要我们对数值进行格式化的输出,包括控制位数、对齐、千位分隔符等方式,有什么处理方案?虽然可用,但是不支持千位分隔符等操作,所以对比起更加现代化的 format()对于一个单独的数值做格式化输出,直接使用内建的 format()如果想要采用科学计数法,那么只需要将 f。方法外,之前很多程序员也会采用 %方法,还是更为推荐后者。除了 format()

2024-06-26 07:47:32 412

原创 【Python Cookbook】S03E02 执行精确的小数计算 decimal, math.fsum()

对象基于十进制数,而非二进制数,不直接在硬件上运行,而是以软件模拟十进制的方式进行计算。优点在于的确能够提供精确的十进制表示和计算,但是缺点很明显,区别于直接在硬件上计算,其会运行的较慢。关于浮点数,一个人尽皆知的问题就是其无法精确地表达出所有十进制小数位,因此甚至简单的数字也会引入微小的误差。由于计算内存有限,不能存储无限循环小数,必须对小数进行四舍五入或者截断,至此,产生误差。并非浮点数运算的最佳方案,或者说,没有最佳方案,选择只有最合适的吧。此时,如果我们需要更高的精度,则可以使用。

2024-06-26 07:47:19 629

原创 【Python Cookbook】S03E01 对数值进行取整 int() round() math.ceil() math.floor() 函数

Python 中若需要对数值进行取整操作,有如下几个函数支持:int() round() math.ceil() math.floor() 函数,以及下一节要介绍的 decimal 函数。需要关注的是,rounf() 函数的四舍五入方式是遵循银行家舍入规则的。

2024-06-20 15:47:47 605

原创 【Python Cookbook】S02E16 在字节串上执行文本操作

Python 处理字节串,字节串与字节函数,为什么不建议使用字节串,虽然字节串相比字符串会在性能上有略微的提升

2024-06-20 13:04:44 505

原创 【Python Cookbook】S02E15 在文本中处理 HTML 和 XML 实体

对于 HTML 以及 XML 文本的转换处理,推荐使用 html.escape(), html.unescape(), xml.sax.saxutils.unescape() 函数等进行处理

2024-06-20 11:18:48 339

原创 【Python Cookbook】S02E14 以固定的列数重新格式化文本 —— textwrap.fill(text, width, subsequent_indent=)

在 Python 中,对于一段长文本最简单的整理方式,规定其每一行输出内容的长度,请通过 textwrap 模块的 .fill(text, width) 函数来解决,其还支持参数 subsequent_indent 来限定是否需要前加入空格

2024-06-20 10:30:47 427

原创 【Python Cookbook】S02E13 给字符串中的变量名做插值处理 —— 推荐 format() 与 format_map() 方法

给字符串中的变量名做插值处理,推荐使用 format() 以及 format_map() 方法,当然也有 string.Template 方法也可用,但是 format 方案更为现代化

2024-06-20 10:13:22 480

原创 【Python Cookbook】S02E12 字符串的连接及合并 ‘ ‘.join()

Python 字符串连接,怎样选择,推荐从字符串大小以及I/O系统调用的角度考虑~比较推荐使用 .join() 方法

2024-06-19 18:17:06 682

原创 【Python Cookbook】S02E11 对齐文本字符串 ljust() rjust() center() format()

Python 常用的对齐文本字符串内置函数 ljust() rjust() center() 以及通用性更强的 format() 函数

2024-06-19 12:08:40 353

原创 【Python Cookbook】S02E10 从字符串中去除不需要的字符

如何从字符串中去除不需要的字符,除了首部尾部可以选择使用 strip(), lstrip(), rstrip() 三个函数外,中间部分选用 replace() 以及正则化的 re.sub() 函数

2024-06-07 17:16:06 339

原创 【Python Cookbook】S02E09 将 Unicode 文本统一表示为规范形式 NFD、NFC

Python 中处理 Unicode 的一些方法以及 unicodedata 模块

2024-06-07 12:46:21 258

原创 【Python Cookbook】S02E08 编写多行模式的正则表达式

除了常见的 re.DOTALL 方法可以实现多行模型的匹配外,更多复杂的情况下,需要通过自定义的方式。

2024-06-07 12:25:02 979

原创 【Python Cookbook】S02E07 如何定义正则表达式模式从而准确匹配内容,通过 ? 调整贪心策略为非贪婪

正则化表达式中,通过添加?可以调整贪婪策略为非贪婪,从而更好的限制模式匹配规则,提取出更符合我们想要的结果

2024-06-06 23:43:12 471

原创 【Python Cookbook】S02E06 以不区分大小写的方式对文本做查找和替换 re.IGNORECASE

python 如何以一种不改变原字符串内容大小写的方案,从而能够以不区分大小写的方式识别出指定内容,并进行有效替换。

2024-06-06 22:36:09 547

原创 【Python Cookbook】S02E05 替换文本 re.sub(),re.subn() 以及 回调函数

Python 替换字符串中文本的办法,正则化 re.sub(),通过指定旧模式识别以及新模式变换,从而更改数据中指定字段内容的格式,通过回调函数,得以实现更加复杂的功能

2024-06-06 17:58:52 685

原创 【Python Cookbook】S02E04 文本模式的匹配和查找 match()、search()、findall() 以及 捕获组和 + 的含义

正则化匹配,match() search() 与 findall() 三个函数的使用方法、限制和返回值的形式,以及捕获组、和 + 的含义。

2024-06-06 13:17:58 929

原创 【Python Cookbook】S02E03 fnmatch 模块做字符串匹配

fnmatch 模块中的 fnmatch() 函数以及严格固定大小写的 fnmatchcase() 函数做内容匹配

2024-06-06 13:16:47 458

原创 【计算机网络】P3 计算机网络协议、接口、服务的概念、区别以及计算机网络提供的三种服务方式

计算机网络协议、接口、服务的概念,计算机网络的三种服务方式,即 面向连接/无连接服务、可靠/不可靠服务以及有无应答服务

2024-06-05 19:00:39 2736

原创 【计算机网络】P2 计算机网络体系结构基本概念,涉及分层的基本术语、SDU、PCI 与 PDU 的概念以及层次结构的含义

计算机网络体系结构的基本概念,SDU、PCI 以及 PDU 的概念,在各层中 PDU 不同的名称,层次结构的含义概念,下层与上层之间服务的关系,数据的传递

2024-06-05 12:57:33 1413

原创 【Python Cookbook】S02E02 在字符串的开头或者结尾处做文本匹配

需要对字符串前缀以及后缀做检查,请使用 startswith() 与 endswith() 函数

2024-06-04 13:30:25 265

原创 【Python Cookbook】S02E01 针对任意多的分隔符拆分字符串

xxx.split("") 与 re.split(pattern, xxx) 是不同的。如果只是简单的针对单个规则拆分,字符串的 split 是足够的,但是如果需要需要对多个规则进行拆分,则请选择正则化.split()

2024-06-04 12:04:44 417

原创 【Python Cookbook】S01E17 将多个映射合并为单个映射

如何将多个字典或者映射合并为单个映射,建议使用 collections.ChainMap() 类,但也可通过字典本身的 update(),结合使用场景,进行选择。

2024-06-03 19:07:49 469

原创 【Python Cookbook】S01E16 同时对数据做转换和换算

当对数据同时做转换和换算时,选择生成器表达式,若考虑性能以及内存,临时的列表等能省则省

2024-06-03 19:06:38 275

原创 【Python Cookbook】S01E15 将名称映射到序列的元素中

对访问列表或者元组中的元素,减少使用索引或下标,通过 collections.namedtuple() 的方法,指定名称以及参数,增强代码的可读性

2024-06-03 19:04:48 404

原创 【Python Cookbook】S01E14 从字典中提取子集

从字典中提取子集,请使用,字典推导式:{key, value for key, value in prices.items()}

2024-06-03 19:03:37 167

原创 【Python Cookbook】S01E13 筛选序列中的元素

过于复杂的筛选条件时,列表推到式不适用,那么可以使用内建的 filter(function, values) 函数做处理

2024-06-03 19:02:01 395

原创 【Python Cookbook】S01E12 根据字段将记录分组

根据字段对字典进行分组,如果需要有序,请使用 operator.itemgetter 搭配 itertools.groupby 使用,如果不需有序,直接使用 operator.defaultdict() 即可

2024-06-02 23:52:16 400

原创 【Python Cookbook】S01E11 通过公共键对字典列表进行排序

对内容进行排序,建议使用 operator.itemgetter() 函数

2024-06-02 12:33:25 379

【LangChain】P0 外部知识库案例

【LangChain】P0 外部知识库案例

2024-09-05

PIL案例图片 volvo-xc90.jpg

博文 【计算机视觉】PIL库-python图像处理类库 的案例图片 volvo_xc90.jpg 该图片大小为1920*1080,RGB图片

2022-10-28

rain.jpeg 图为香港街景图片,目标为消除该街景图片中的噪点

该图片为包含很多噪点的香港街景图片。博客中通过高斯平滑滤波消除噪点。

2022-10-20

4个变量的数据集,仅用于学习

4个变量的数据集,仅用于学习

2022-10-01

Bandicam录屏软件 包含Windows版本以及MacOS版本

仅用于个人学习

2022-04-18

HDF reader 读取HDF数据集文件专用轻量级软件

仅用于个人学习,软件为读取HDF数据集轻量级软件

2022-04-18

EVCapture 电脑录屏软件(免费)

仅用于个人学习,若需要删除请联系或留言。

2022-04-18

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除