自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

坚果的刻薄

发一些自己整理的课本知识,还有网上抄的作业

  • 博客(31)
  • 收藏
  • 关注

原创 wordcloud生成词云图(含形状、颜色设置)

一、导入和主要方法1、导入wordcloud包一班生成词云图之后还要显示出来,所以还会用到matplotlib如果要设置mask蒙版,还需要从imageio导入imread()函数如果需要设置词云中字体的颜色,还会用到matplotlib中的colorsimport wordcloudimport matplotlib.pyplot as pltfrom imageio import imreadfrom matplotlib import colors2、主要方法wc = wordc

2021-06-02 14:50:53 44656 5

原创 jieba分词

一、jieba简介jieba库是一款优秀的 Python 第三方中文分词库,jieba 支持三种分词模式:精确模式、全模式和搜索引擎模式,下面是三种模式的特点。精确模式:试图将语句最精确的切分,不存在冗余数据,适合做文本分析。全模式:将语句中所有可能是词的词语都切分出来,速度很快,但是存在冗余数据。搜索引擎模式:在精确模式的基础上,对长词再次进行切分,提高召回率,适合用于搜索引擎分词。#精确模式jieba.lcut(text, cut_all=False)#全模式jieba.lcut

2021-06-01 09:35:00 31377 3

原创 Pandas基础——Series

本文将讲解Pandas数据结构中的Series。Series类似于字典,但不是字典,因为他的索引可以是重复的。一、Series的创建使用pd.Series()从DataFrame中取出一行或者一列1.1、 使用pd.Series()第二种方法主要在DataFrame的讲解中介绍,这里主要讲解使用前者pd.Series(),里面的参数可以是普通的列表,也可以是字典、其他的ndarray或者标量值。使用标量值1.2、从DataFrame中取出一行或者一列使用DataFrame中的一

2021-05-24 17:24:45 2925

原创 Pandas基础——DataFrame

一、pandas简介Pandas是字典形式,基于NumPy创建,让以NumPy为中心的应用变得更加简单。Pandas有两种数据结构,Series和DataFrame。Numpy的是ndarray。二、SeriesSeries类似于字典,但不是字典,因为他的索引可以是重复的。1、Series的创建可以使用pd.Series()也可以是从DataFrame中取出一行或者一列的返回值。这里主要讲解使用前者pd.Series(),里面的参数可以是普通的列表,也可以是字典、其他的ndarray或者标量

2021-05-18 20:05:50 1995

原创 Numpy的其他常用方法

1、np.eye(shape)形成单位阵。2、np.tile(n,shape)将数组n作为一个大的“元素”,按照shape形式进行复制。

2021-05-18 09:24:58 124

原创 Matplotlib基础知识

Matplotlib是数据可视化的基础,可以用来绘制线图、散点图、等高线图、条形图、柱状图、3D 图形、甚至是图形动画等 matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式。  导入方式import matplotlib.pyplot as plt  英文释义英文汉语plotn情节;v绘制表格,密谋grid网格tick标记,刻度axis轴axes轴的复数形式几个对象的关系figure相当于画板,axis就

2021-05-17 13:36:37 2246

原创 numpy的广播机制、布尔索引、切片索引、花式索引

布尔索引布尔索引,就是将元素都是布尔值的数组作为索引在另一个数组中取出元素的做法。如下例,booling1为布尔数组,下标为0,3,4的位置是True,因此将会取出目标数组arr中对应位置的元素。In [24]: arr = np.arange(7)In [25]: booling1 = np.array([True,False,False,True,True,False,False])In [26]: arr[booling1]Out[26]: array([0, 3, 4])如果布尔数

2021-05-11 11:54:37 1568 1

原创 Numpy简单方法

1、Numpy简介1.1、使用Numpy,主要是因为它能够方便快速的进行矩阵运算,涵盖线性代数运算、傅里叶变换和随机数生成等功能。1.2、Numpy中的ndarray是一个多维数组,该对象由描述数据的元数据和数据本身组成,一般的修改只是针对元数据,而不会修改实际数据。1.3、Numpy中的数据元素一般都是用来存储一样类型的。2、ndarray对象的属性2.1、属性名2.2、属性的几种理解(1)ndim,秩,也是维数,同时等于len(n.shape)(2)shape,形状元组元素个数代表维数

2021-04-27 09:54:23 244

原创 python有关类定义和使用的一些小问题

1、构造方法__init__(self,):当创建这个类的实例时,系统会自动调用该方法,对实例属性进行初始化。当用户没有显示定义init构造方法的时候,系统会自动生成一个缺省的构造方法。2、有关类方法、实例方法、静态方法;还有类属性、实例属性的解释都在下文有详细阐述1、简述类方法和实例方法的区别答:(1)类方法声明之前要有一句@classmethod(2)类方法第一个参数是cls;实例方法第一个参数是self(3)类方法可以使用类名调用和实例调用;实例方法只能使用实例调用。(4)类方法,因为没

2021-04-14 11:29:45 326 1

原创 python列表遍历循环中删除元素出错的问题

1、在列表循环中对列表元素进行删除操作,会不会出错?   解答:结果不正确。例子:  原因是:因为删除元素后,整个列表的元素会往前移动,指针是不断增大的。for循环实际是循环的列表下标(索引),同时由于列表的可变性,每一次删除一个元素,列表的长度就会发生变化,元素的索引也会发生变化(List的Remove方法在删除元素的时候总会保持下标连续。例如,删掉第一个元素的时候,后面的元素会依次往前覆盖)。例如上题:  第一次循环,循环索引为0,刚开始指针指向列表的第一个元素即a[0]=1,判断后直接删除该元

2021-04-13 10:32:36 1318

原创 python集合set

集合是无序组合,它没有索引和位置的概念。集合有两种,一种是可变类型的set,一种是不可变的frozenset。我们经常遇到就是set集合。创建集合set()  创建空集合set(iterable) 利用可迭代对象创建集合{1,2,“haha”} 直接用填充值创建,但是{}创建的是空字典,而不是空集合常用函数1、add(x)如果集合s中不存在元素x,则将元素x添加到集合s中。即使有了这个值也不会把报错,有点类似字典覆盖赋值。s = {1,2,3}s.add(4)2、clear()

2021-04-02 20:51:53 297

原创 情感分析知识总结

这篇文章的主要内容就是总结一下中文情感分析流程中的主要技术都有哪些。中文情感分析总体步骤包括:中文分词去除停用词文本向量化情感分析其中分词和去除停用词属于数据的预处理1、中文分词因为句子的最小单位是字,可是一般我们将词语作为最小的能够独立活动的语言单位,因此需要将句子进行分词处理。现在常用的分词系统有结巴分词系统、中科院的NLPIR系统和Hanlp系统...

2021-03-30 16:02:51 205

原创 python内置函数

函数名作用abs(a)返回a的绝对值,a可以是浮点型、整型,如果是复数就会返回模all(iterable)对于可迭代对象的每个元素,如果都是真,则返回True,如果迭代对象无元素,返回Trueany(iterable)对于可迭代对象的每个元素,只要有一个是真,则返回True,如果迭代对象无元素,返回False...

2021-03-30 10:16:22 116

原创 python断言assert

断言断言assert一般使用做自动化测试,放在程序中的某些地方,如果断言被满足了,程序就会若无其事地继续运行下去,一旦不满足断言的要求(一般就是理想的程序执行效果)就会立即抛出异常AssertionError并且退出程序。想起来,这比我们加if判断然后sys.exit()好多了,而且断言还会告诉你是哪里设置的断言没有被满足,就可以溯源。使用使用方法有好多高级的用法,在这里因为是初步了解,所以就简单了解一下。assert 后面跟一个判断条件a = 6assert a > 7#断言当然

2021-03-24 19:52:44 436

原创 python--类的创建和使用

创建Dog类class Dog(): def __init__(self,name,age): """初始化name和age""" self.name = name self.age = age self.kind = "dog" #设置默认值 def sit(self): """模拟坐下""" print(self.name,"is sitting now.")

2021-03-21 15:11:13 310

原创 python--pprint库

pprint库,漂亮打印,相比于print()直接打印在同一行,pprint能够将可迭代类型每一项都另起一行打印,起到美化的效果。pprint库有两个常用函数pprint()和pformat(),前者是直接打印,后者返回一个字符串(同样是美化之后的,打印出来也是美化的)pprint()pprint(indent = 1,width = 80,depth = None,stream = None)indent 缩进width 宽度,默认是80depth 打印深度,就是打印深入到几层可迭代类型s

2021-03-21 09:33:23 441

原创 python----正则表达式re库

正则表达式是干什么的使用正则表达式就是为了从一大串子字符串中获取你想要的那部分,如果你明确的知道你想要的就是字符串"wjg946"那么就不需要使用一些高级的匹配用法,其实如果你知道了你想要的字符串就是"wjg946"那还匹配什么,所一般都是只知道所需字符串的部分特征,要做的就是根据这些特征把想要的字符串从大量文本中揪出来。python中使用正则表达式一般都是使用re库,所以写这个。基本知识1、匹配规则d w s.匹配任意1个字符(除了换行符\n)[ ]匹配 [ ] 中

2021-03-19 14:12:52 221

原创 resquests的get和post参数

requests库中response的基本属性response.encodingresponse.status_code200是正常,4XX是客户端错误,5XX是服务器错误。response.content是字节方式的响应体,会自动解码gzip和deflate编码的响应数据response.json()是Requests中内置的JSON编码器传递URL参数url参数就是以键值对形式跟在网址后面的,在requests中,可以直接把这些参数保存在字典中,然后使用params参数

2021-03-18 15:50:43 546

原创 Python下的json使用

概念介绍1、JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。2、在python中的json应用就是实现一些数据结构(列表、元组、字典)到字符串之间的转换,当数据结构变为字符串之后就很容易在程序之间传递。3、Python中序列化指的是将Python中的数据结构(列表、元组、字典)编码转换为JSON格式的字符串;而反序列化指的是将JSON格式的字符串编码转换为Python中的数据结构(列表、元组、字典);4、元组经过序列化处理后,再通过反序列化处理后,数据类

2021-03-16 20:53:18 375

原创 python文件操作

open(文件名,打开模式) 打开文件1、文件名可以是相对路劲或绝对路径,如果找不到这个文件就会创建一个(对于这个路径,C:\Users\lenovo\Desktop\sent.txt,如果C:\Users\lenovo\Desktop\路径存在,只是不存在sent.txt文件,那么就会建立一个sent.txt文件,但是如果是前面的文件夹路径都不存在就不会建立文件直接报错FileNotFoundError。也就是新建文件只能是建立一个文件,而不会建立文件夹)2、打开模式r以只读方式打开文

2021-03-16 17:33:41 113

原创 列表排序方法sort()的key参数取值,以及lambda匿名函数

1、sort()方法的key参数li = [[1, 7], [1, 5], [2, 4], [1, 1]]li.sort()print(li) #[[1, 1], [1, 5], [1, 7], [2, 4]] 默认按照每个元素的第0维排序 再按照1维排序,升序def fun(li): #返回列表的第二位数 return li[1]#这时将函数fun传递给参数key 得出结果li.sort(key=fun)print(li) # [[1, 1], [2, 4], [1, 5], [

2021-03-15 22:12:11 2809

原创 python---字符串

1、python字符串使用一对单引号或者一对双引号包括起来,能够使用两种引号而不像其他语言一样只能使用双引号的原因是为了避免字符串内容本省就含有引号时需要使用转义字符,在一定程度上简化了任务。2、转义字符就是用一个反斜杠加一个东西来表示一些不方便放入字符串中的符号\’’\""\反斜杠 \\t制表符\n换行符\的用法,我们还能想到 \ 续行符,用来将一行python代码分到两行进行表示。3、三重引号用三对单引号或者双引号包括起来的内容,可以用做注

2021-03-11 17:10:13 265 1

原创 python---id()探究

id()返回的是变量的内存地址这个问题涉及到Python的变量定义,以及垃圾回收机制a = 2b = 2print(id(a),id(b)) #一致#140712751081280 140712751081280a = [2]b = [2]print(id(a),id(b) )#不一致#1568719225600 1568719218624print(id(a[0]),id(b[0])) #一致#140712751081280 140712751081280egg = [1,

2021-03-11 15:52:50 514 1

原创 python----字典

字典是映射类型的典型代表,字典是 键-值 元素项的组合,每一个元素是一个键值对,表示为(key,value),用于存储不可变但无序的异构对象。这意味着当你试图访问这些元素时,它们的顺序可能与你插入它们的顺序不完全相同。字典与集合具有类似的性质,即字典中的键值对之间是无序的,并且不能重复,也没有下标索引。但是,使词典与列表区别开来的是元素在其中的存储方式。字典中的元素是通过它们的键值而不是它们的索引来访问的,正如我们在列表中所做的那样。所以字典包含键值对,而不仅仅是单个元素。生成词典1、使用dict()

2021-03-06 10:35:43 899

原创 python----元组tuple

基本概念1、元组与列表相似,只不过元组的值不能修改,若要达到“修改”的效果可以借助切片重组一个新的元组。元素之间使用逗号分隔。元组创建1、元组可以用圆括号括起来,表项之间用逗号分隔。也可以不写圆括号。2、空元组就是一对圆括号就行了。3、如果元组内只有一个元素,需要在元素后加一个逗号normal_tuple = ("zhangsan", "lisi", "wangwu")empty_tupl = ()one_tuple = (2,)>>> tuple1 = "a","b"

2021-03-05 23:45:33 912

原创 python----列表list和元组

列表是一种数据类型,列表中的值成为表项,表项之间用逗号分隔。方法是一种函数,方法与特定的某种数据类型绑定在一起,所以,列表有着他自己独特的各种方法。下标1、表项下标只能是整数,不能是浮点值。2、负数下标,-1代表最后一个,-2代表倒数第二个切片切片实现了一次从列表中去除多个表项。list[m:n]list[ :n]list[-1:n]list[ :-1]对列表的处理函数1、len(list),求list列表的表项的个数。2、del list[ n ],删除掉list列表的n下标的表

2021-02-22 23:07:13 1750

原创 python库----random

简介计算机中通过采用梅森旋转算法生成的(伪)随机序列元素。random库包含两类函数,常用的共8个:  基本随机函数: seed(), random()  扩展随机函数:randint(), getrandbits(), uniform(),          randrange(), choice(), shuffle()内部函数介绍random.seed()初始化给定的随机数种子,默认为当前系统时间。使用随机数种子的好处是可以复现有随机数的程序。random.seed(2)#产生种

2021-02-21 11:31:16 104

原创 例题

1一个整数x,奇数则x*3+1,偶数则x/2,循环,最终一定会得到1代码:def collatz(num=None): if num==None: num = int(input("请输入一个整数:")) result=0 if num%2 == 1:#奇数 result = 3*num+1 else:#偶数 result = num/2 print(int(result)) if result == 1:

2021-02-18 11:19:16 94

原创 有关函数定义,全局变量,局部变量,顺便解释print()用法

print()函数的解释:print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False) Prints the values to a stream, or to sys.stdout by default. Optional keyword arguments: file: a file-like object (stream); defaults to the current sys.stdout.

2021-02-18 10:15:10 590

原创 控制流

比较操作符==!=<><=>=布尔操作符and---- &(不是java里的&&)or----- |(不是||)not-----更没有4!>2和4not>2的写法,!=是唯一的!用法也就是说!的用法有两个,一个是!=,另一种是!后面跟boolean型变量not的用法只有一个,就是后面跟boolean变量,也就是!的第二个用法and和or的用法就是有连接两个boolean变量控制流语句ifelse

2021-02-17 11:01:51 122

原创 Python基础语法

基本运算符** 指数% 取余数// 取整基本方法len()主要对str处理,求字符串的长度str()把int、float转换成str,才能将str和int、float拼接成一个字符串,进行打印等处理int()将内容为int的字符串,化成int,常常用来处理input()得到的字符串float()作用同上,这也体现出,int()不能用来处理内容是浮点型的input()name = input("请输入您的姓名")其他需要注意的str+int,或者str+floa

2021-02-17 08:54:54 186

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除