自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 问答 (1)
  • 收藏
  • 关注

原创 基于word2vec的语言模型实践

构造三个不同的词典,分别储存每个词和id的映射关系:word2id_dict,每个id出现的频率:Word2id_freq,每个id到词典映射关系:id2word_dict。with open ("./text8.txt",'wb') as f:#wb以二进制格式打开文件,存在则覆盖,不存在则创建。corpus=corpus.strip().lower()#大写转小写、去空格。#把下载好的文件存储在当前的目录的text8.txt文件中。#使用Python的request包下载数据集到本地。

2023-12-05 17:50:42 60

原创 python_异常处理

也可以添加else,相当于执行完try后继续执行的内容;程序正常时执行try里面的内容,发生异常时执行语句块2。无论是否异常,finally中的语句块4都会执行。支持添加多个except。

2023-06-05 21:26:27 100 1

原创 NLP学习——正则表达式re

if len(re.findall('自|然',i)):#列表的长度不为0被认作True值。print(re.findall('^处',i)) #匹配以自开头的内容。print('正则匹配结果是:',re.search('语言',text1))print(re.findall('自|然',i))print(re.findall('自.语',text1))print(re.findall('^自',i))print(re.findall('^语',i))

2023-05-22 11:38:21 199 2

原创 爬虫知识积累

lxml.etree.HTML(data)是Lxml库中的方法,用于将HTML字符串data解析为可操作的Element对象,这样可以使用Element对象的各种方法来操作和查询HTML文档。具体来说,该方法会将HTML字符串转换为Element树,即一个由元素节点和文本节点构成的树状结构,每个节点都有相应的标签名、属性和内容。在使用该方法时,需要先导入lxml库,并将HTML字符串传递给HTML()方法。该代码会输出:Hello World,表示成功提取了HTML文档中的h1元素的文本内容。

2023-05-20 11:34:51 318 1

原创 联想小新电脑重装win10系统后指纹解锁不能用了

下载一个联想电脑管家,更新驱动。

2023-05-18 15:29:37 1051 1

原创 python_print()

的作用就是让这个元素作为元组的元素,而不是独立的参数。print(a)和print((a))有什么区别。print(a)和print([a])的区别。输出的是这个列表的字符串表示形式,类似于。,那么会输出一个元组,元组只包含一个元素。输出包含该列表的单一元素的列表,类似于。输出该列表的字符串表示形式,类似于。,但是由于该元组只包含一个元素。中的两个括号的位置,即写成。传递了一个只包含一个元素。需要注意的是,如果你改变了。是等价的,都是输出变量。,这个列表包含一个元素。的输出结果是不同的。

2023-05-18 15:13:17 1029 1

原创 NLP学习——NLTK

是Natural Language Toolkit中用于文本分析的类,它接受一个文本列表作为参数,并转换为一个可操作的文本类对象。这个对象提供了很多文本分析的方法和功能,例如查找词语、查找上下文、查找词语共现等等。这个例子展示了如何将文本集合转换为一个nltk.Text对象,并使用。方法搜索文本中包含"monstrous"的上下文内容。

2023-05-18 14:57:38 121

原创 Python期末复习知识点汇总一(课本)

第一章“>>>”是Python语言运行环境的提示符,其表示可以在此符号后面输入Python语句 在提示符后输入exit()或者quit()可退出Python运行环境。 Python的语言特点(解释型):​​​​​​​语法简洁 与平台无关 粘性扩展(具有优异的扩展性) 通用灵活 强制可读(通过强制缩进来体现语句间的逻辑关系) 支持中文(采用utf-8编码表达所有字符信息) 模式多样 类库丰富每个程序都有一套统一的运算模式:输入数据,处理数据,和输出数据。(IPO)(Inp

2022-04-13 20:56:46 2153 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除