自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 打开文本是出现编码错误

是在编写中文的词频分析时遇到的先把词频分析的代码放上去# 对三国演义出场人物次数进行统计import jiebatxt = open("sanguoyanyi.txt","r",encoding="utf-8").read()words = jieba.lcut(txt)new={}#通过对程序的检查,对程序进行完善for word in words: if len(word)...

2018-06-13 17:28:44 2087

原创 jieba库以及文本词频统计

简介◆ jieba库是优秀的中文分词第三方库◆ jieba库和其他的第三方库一样,在cmd中使用pip install jieba 就可以进行安装◆ jieba最常用的函数只有一个,在下面我们会见到jieba库的三种模式及其函数◆ 精确模式:jieba.lcut(s)    对文本s进行分词◆ 全局模式:jieba.lcut(s,cut_all=True)   进行分词之后存在冗余◆ 搜索引擎模式...

2018-06-13 17:03:54 5901 2

原创 字典类型数据

简介◆ 键值对:键是数据索引的扩展◆ 字典是键值对的集合,键值对之间无序◆ 采用大括号{}和dict()创建,键值对用冒号:表示◆ 理解映射的概念,映射是一种键和值得对应关系字典类型数据的基本函数◆ del d[k]              删除字典d键k所对应的数据值◆ k in d                 判断k是否是字典d的键◆ d.keys()              返回字典...

2018-06-13 10:07:12 3002

原创 序列数据类型

简介◆ 序列是一维元素向量,元素类型可以不同◆ 类似数学上的序列◆ 元素间由序号引导,通过下标访问序列的特定元素◆ 主要类型包括:字符串类型、元祖类型、列表类型通用的操作符◆ s + t            连接两个序列s和t◆ s*n或n*s      将序列s复制n次◆ s[i]               索引序列s中的i元素◆ s[i:j:k]           索引序列s中从i到j,...

2018-06-11 11:29:45 4926

原创 D&C与快速排序

D&C简介D&C的意思是分而治之,它是一种著名的递归式问题解决方法。使用D&C来解决问题的过程包括两个步骤:(1) 找出基线条件,这种条件必须尽可能简单(2) 不断将问题分解(或者说缩小规模),直到符合基线条件例子求列表[2,4,6]的和(1) 找出基线条件。列表中不包含元素(2) 缩小问题规模。将求列表[2,4,6]的和转化为任意取出一个元素[2]与剩余列表[4,6]的和...

2018-06-06 16:19:23 462

原创 集合数据类型

简介• 集合用大括号{}表示,元素间用逗号分隔• 建立集合类型用{}或者set(),建立空集合类型,必须用set()• 集合中每个元素必须唯一,不存在相同元素• 集合中的元素之间无序主要的操作符和函数操作符• A|B     A和B中的所有的元素            • A-B   包含A但是不包含B的元素            • A&B    同时属于A和B的元素• A^B   包含...

2018-06-06 10:57:50 1763

原创 random库与使用蒙特卡洛方法计算圆周率

简介random库Python的另一个标准库,它主要是用来生成随机数的。random库生成的随机数是采用梅森旋转算法生成的(伪)随机数。主要的函数常用函数random.seed(a=None)初始化一个随机数的种子,默认为系统的时间。相同的种子对应的随机数是相同的。random.random()随机生成(0.0,1.0)之间的小数。这个函数在随机数使用中比较常用。通过一个实例...

2018-05-30 15:46:38 1804

原创 Python的time库和文本进度条

简介Python中的time库是用来使用时间的标准库,它可以表示计算机的时间,也可以获取系统的时间并提供精准的时间计量,从而分析系统的性能。主要的函数获取时间time.time()获取计算机当前的时间,格式为计算机内部的浮点数时间time.ctime()获取计算机的时间,其格式为人容易理解的格式time.gmtime()同样是获取计算机的时间,但是它为计算机容易理解和处理的格式格式化时间time....

2018-05-29 11:22:47 851

原创 Python中的turtle库

简介turtle库是turtle绘图体系在Python中的实现,turtle绘图体系诞生于1969年,主要用于程序设计入门,它是Python中的一种标准库,也是入门级的绘图函数库。主要的函数1、turtle.setup(width,height,x,y)这个函数主要是用来设置Python绘图界面的位置,其中,width和height两个参数是绘图界面的宽高,x,y两个参数是绘图界面左上角距离屏幕左...

2018-05-24 17:38:44 1585

原创 递归和栈

递归递归是很多算法中都使用的一种编程方法。递归包含两部分:基线条件和递归条件。基线条件是函数不再调用自己的条件,而递归条件就是继续调用自己递归的条件。下面举个例子来说明什么是基线条件?什么是递归条件例:编写一个倒计时函数,从3倒计时到1结束# 倒计时3 2 1def dict(i): print(1) # 基线条件 if i <= 1: return...

2018-05-17 15:55:48 1169

原创 选择排序

选择排序简介选择排序(Selection sort)是一种简单直观的排序算法。它的工作原理是每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完。以上介绍出自360百科例子对列表[5,3,6,2,10]进行选择排序代码# 升序排列# 定义函数findsmallest()查找列表中的最小元素def findsmallest(list): ...

2018-05-14 20:14:32 161

原创 二分查找

二分查找简介二分查找是一种算法,它要处理的元素列表必须是个有序。因为二分查找每次都会通过比较中间那个数与要求的数的大小,来舍弃一般的列表。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。例子从1到100中选定一个数,然后你来猜测。你每次猜测后,我只会告诉你大了、小了或正确。(假设选定的是75)(1)针对这个例子,假如从1开始猜的话,那么需要75次才会猜对。(2)如果使用二分查找...

2018-05-12 16:21:34 194

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除