- 博客(388)
- 资源 (3)
- 问答 (2)
- 收藏
- 关注
原创 【自然语言处理】P1 自然语言处理概述
自然语言指的是人类的语言,如中文、英语等,处理特指使用计算机技术处理,所以自然语言处理(NLP)就是指使用计算机处理人类的语言。自然语言处理属语言学、计算机科学、信息工程和人工智能的交叉领域,涉及的内容非常广泛。人类的语言本身是复杂的,所以自然语言处理的任务也是多种多样的。
2025-01-14 16:01:02 1263
原创 【Python Cookbook】S03E07 处理无穷大以及NaN
中并没有开启这个功能,且模块需要与平台高度相关结合,只针对专家级的程序员使用。中没有特殊的语法直接表示这些特殊的浮点数值。但是我们可以通过用浮点数。有时候,高级程序员希望能够在出现无穷大或者。会通过所有的操作进行传播,且不会引发任何异常。如果我们需要对浮点数的无穷大、负无穷以及。模块可以用来调整这个行为,但是在标准的。而检测是否出现这些值,可以通过使用。而正是因为这样,唯一安全检测。的行为,让它能够抛出异常值。中表示无穷大、负无穷以及。进行判断测试,该怎么做?
2024-07-17 20:00:00 274
原创 【Python Cookbook】S03E06 复数运算 .real .imag 等
在标准数学函数模型情况下,不会产生复数值。也不会突然意外的出现的结果中。如果要对复数执行一些复杂的数学操作,比如计算正弦、余弦或者平方根,可以使用。很多问题虽然小众,但是我们的确需要使用复数来计算解决。认证方案交互时遇到了奇点问题,而唯一的解决方案就是在复平面解决问题。复数常用的指定方式有三种,第一种是直接通过后缀。但是如果我们希望产出复数的结果,那么先通过。模块声明我们要使用复数。
2024-07-17 09:09:14 616
原创 【Python Cookbook】S03E05 从字节串中打包和解包大整数 int.from_bytes() 以及x.to_bytes()
字节串与大整数之间的转换,int.from_bytes() 以及 x.to_bytes()
2024-07-11 19:00:00 982 1
原创 【Python Cookbook】S03E03 对数值做格式化输出 format()
如果需要我们对数值进行格式化的输出,包括控制位数、对齐、千位分隔符等方式,有什么处理方案?虽然可用,但是不支持千位分隔符等操作,所以对比起更加现代化的 format()对于一个单独的数值做格式化输出,直接使用内建的 format()如果想要采用科学计数法,那么只需要将 f。方法外,之前很多程序员也会采用 %方法,还是更为推荐后者。除了 format()
2024-06-26 07:47:32 412
原创 【Python Cookbook】S03E02 执行精确的小数计算 decimal, math.fsum()
对象基于十进制数,而非二进制数,不直接在硬件上运行,而是以软件模拟十进制的方式进行计算。优点在于的确能够提供精确的十进制表示和计算,但是缺点很明显,区别于直接在硬件上计算,其会运行的较慢。关于浮点数,一个人尽皆知的问题就是其无法精确地表达出所有十进制小数位,因此甚至简单的数字也会引入微小的误差。由于计算内存有限,不能存储无限循环小数,必须对小数进行四舍五入或者截断,至此,产生误差。并非浮点数运算的最佳方案,或者说,没有最佳方案,选择只有最合适的吧。此时,如果我们需要更高的精度,则可以使用。
2024-06-26 07:47:19 629
原创 【Python Cookbook】S03E01 对数值进行取整 int() round() math.ceil() math.floor() 函数
Python 中若需要对数值进行取整操作,有如下几个函数支持:int() round() math.ceil() math.floor() 函数,以及下一节要介绍的 decimal 函数。需要关注的是,rounf() 函数的四舍五入方式是遵循银行家舍入规则的。
2024-06-20 15:47:47 605
原创 【Python Cookbook】S02E16 在字节串上执行文本操作
Python 处理字节串,字节串与字节函数,为什么不建议使用字节串,虽然字节串相比字符串会在性能上有略微的提升
2024-06-20 13:04:44 505
原创 【Python Cookbook】S02E15 在文本中处理 HTML 和 XML 实体
对于 HTML 以及 XML 文本的转换处理,推荐使用 html.escape(), html.unescape(), xml.sax.saxutils.unescape() 函数等进行处理
2024-06-20 11:18:48 339
原创 【Python Cookbook】S02E14 以固定的列数重新格式化文本 —— textwrap.fill(text, width, subsequent_indent=)
在 Python 中,对于一段长文本最简单的整理方式,规定其每一行输出内容的长度,请通过 textwrap 模块的 .fill(text, width) 函数来解决,其还支持参数 subsequent_indent 来限定是否需要前加入空格
2024-06-20 10:30:47 427
原创 【Python Cookbook】S02E13 给字符串中的变量名做插值处理 —— 推荐 format() 与 format_map() 方法
给字符串中的变量名做插值处理,推荐使用 format() 以及 format_map() 方法,当然也有 string.Template 方法也可用,但是 format 方案更为现代化
2024-06-20 10:13:22 480
原创 【Python Cookbook】S02E12 字符串的连接及合并 ‘ ‘.join()
Python 字符串连接,怎样选择,推荐从字符串大小以及I/O系统调用的角度考虑~比较推荐使用 .join() 方法
2024-06-19 18:17:06 682
原创 【Python Cookbook】S02E11 对齐文本字符串 ljust() rjust() center() format()
Python 常用的对齐文本字符串内置函数 ljust() rjust() center() 以及通用性更强的 format() 函数
2024-06-19 12:08:40 353
原创 【Python Cookbook】S02E10 从字符串中去除不需要的字符
如何从字符串中去除不需要的字符,除了首部尾部可以选择使用 strip(), lstrip(), rstrip() 三个函数外,中间部分选用 replace() 以及正则化的 re.sub() 函数
2024-06-07 17:16:06 339
原创 【Python Cookbook】S02E09 将 Unicode 文本统一表示为规范形式 NFD、NFC
Python 中处理 Unicode 的一些方法以及 unicodedata 模块
2024-06-07 12:46:21 258
原创 【Python Cookbook】S02E08 编写多行模式的正则表达式
除了常见的 re.DOTALL 方法可以实现多行模型的匹配外,更多复杂的情况下,需要通过自定义的方式。
2024-06-07 12:25:02 979
原创 【Python Cookbook】S02E07 如何定义正则表达式模式从而准确匹配内容,通过 ? 调整贪心策略为非贪婪
正则化表达式中,通过添加?可以调整贪婪策略为非贪婪,从而更好的限制模式匹配规则,提取出更符合我们想要的结果
2024-06-06 23:43:12 471
原创 【Python Cookbook】S02E06 以不区分大小写的方式对文本做查找和替换 re.IGNORECASE
python 如何以一种不改变原字符串内容大小写的方案,从而能够以不区分大小写的方式识别出指定内容,并进行有效替换。
2024-06-06 22:36:09 547
原创 【Python Cookbook】S02E05 替换文本 re.sub(),re.subn() 以及 回调函数
Python 替换字符串中文本的办法,正则化 re.sub(),通过指定旧模式识别以及新模式变换,从而更改数据中指定字段内容的格式,通过回调函数,得以实现更加复杂的功能
2024-06-06 17:58:52 685
原创 【Python Cookbook】S02E04 文本模式的匹配和查找 match()、search()、findall() 以及 捕获组和 + 的含义
正则化匹配,match() search() 与 findall() 三个函数的使用方法、限制和返回值的形式,以及捕获组、和 + 的含义。
2024-06-06 13:17:58 929
原创 【Python Cookbook】S02E03 fnmatch 模块做字符串匹配
fnmatch 模块中的 fnmatch() 函数以及严格固定大小写的 fnmatchcase() 函数做内容匹配
2024-06-06 13:16:47 458
原创 【计算机网络】P3 计算机网络协议、接口、服务的概念、区别以及计算机网络提供的三种服务方式
计算机网络协议、接口、服务的概念,计算机网络的三种服务方式,即 面向连接/无连接服务、可靠/不可靠服务以及有无应答服务
2024-06-05 19:00:39 2736
原创 【计算机网络】P2 计算机网络体系结构基本概念,涉及分层的基本术语、SDU、PCI 与 PDU 的概念以及层次结构的含义
计算机网络体系结构的基本概念,SDU、PCI 以及 PDU 的概念,在各层中 PDU 不同的名称,层次结构的含义概念,下层与上层之间服务的关系,数据的传递
2024-06-05 12:57:33 1413
原创 【Python Cookbook】S02E02 在字符串的开头或者结尾处做文本匹配
需要对字符串前缀以及后缀做检查,请使用 startswith() 与 endswith() 函数
2024-06-04 13:30:25 265
原创 【Python Cookbook】S02E01 针对任意多的分隔符拆分字符串
xxx.split("") 与 re.split(pattern, xxx) 是不同的。如果只是简单的针对单个规则拆分,字符串的 split 是足够的,但是如果需要需要对多个规则进行拆分,则请选择正则化.split()
2024-06-04 12:04:44 417
原创 【Python Cookbook】S01E17 将多个映射合并为单个映射
如何将多个字典或者映射合并为单个映射,建议使用 collections.ChainMap() 类,但也可通过字典本身的 update(),结合使用场景,进行选择。
2024-06-03 19:07:49 469
原创 【Python Cookbook】S01E16 同时对数据做转换和换算
当对数据同时做转换和换算时,选择生成器表达式,若考虑性能以及内存,临时的列表等能省则省
2024-06-03 19:06:38 275
原创 【Python Cookbook】S01E15 将名称映射到序列的元素中
对访问列表或者元组中的元素,减少使用索引或下标,通过 collections.namedtuple() 的方法,指定名称以及参数,增强代码的可读性
2024-06-03 19:04:48 404
原创 【Python Cookbook】S01E14 从字典中提取子集
从字典中提取子集,请使用,字典推导式:{key, value for key, value in prices.items()}
2024-06-03 19:03:37 167
原创 【Python Cookbook】S01E13 筛选序列中的元素
过于复杂的筛选条件时,列表推到式不适用,那么可以使用内建的 filter(function, values) 函数做处理
2024-06-03 19:02:01 395
原创 【Python Cookbook】S01E12 根据字段将记录分组
根据字段对字典进行分组,如果需要有序,请使用 operator.itemgetter 搭配 itertools.groupby 使用,如果不需有序,直接使用 operator.defaultdict() 即可
2024-06-02 23:52:16 400
原创 【Python Cookbook】S01E11 通过公共键对字典列表进行排序
对内容进行排序,建议使用 operator.itemgetter() 函数
2024-06-02 12:33:25 379
PIL案例图片 volvo-xc90.jpg
2022-10-28
为什么要在确定模型和参数后再次用完整数据集训练?
2023-08-31
Python中计算问题
2021-04-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人