python自然语言处理-学习笔记(一)

nltk学习第一章 一,入门 1,nltk包的导入和报的下载 import nltk nltk.download() (eg: nltk.download(‘punkt’),也可以指定下载那个包) 2,book图书集,是一些数据, from nltk.book import * ***...

2019-01-17 16:33:34

阅读数:12

评论数:0

虚拟机安装单机python+spark环境

python环境Linux系统是自带的,你可以输入python来查看版本(python2版本),输入python3(python3版本)查看。spark安装前提是要下载压缩包,根据个人需求在官网下载压缩包,放到虚拟机得 /home/用户 目录下(我下的是spark-2.1.1-bin-hado...

2019-01-03 17:14:41

阅读数:9

评论数:0

虚拟机下安装Java环境

虚拟机下安装Java环境,首先得先下载jdk压缩包,这个可以到官网上下载,在这里就不再阐述了。下一步就是把下载下来的压缩包移动到虚拟机下,建议直接移动到home/用户名/ 目录下,也就是终端打开之后默认目录,然后就是解压,命令是 我下载的是jdk-8u101-linux-x64.tar.g...

2019-01-03 11:05:27

阅读数:22

评论数:0

利用jieba进行分词,词云图展示

import jieba from scipy.misc import imread from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator import matplotlib.pyplot as plt import panda...

2018-12-15 09:23:22

阅读数:1104

评论数:0

自定义K-领进算法的实现

k-邻近算法精髓在于欧式距离公式,我们就是模仿这个过程来实现算法,代码如下: import numpy as np def knn_classify(dataset, labels, new_input, k, weight='uniform'): ''' dataset: 输入...

2018-11-24 14:46:24

阅读数:15

评论数:0

python五大算法之插入排序和归并排序

插入排序 def direct_sort(list1): for i in range(1,len(list1)): temp = list1[i] j = i-1 while j >= 0 a...

2018-11-24 14:20:11

阅读数:23

评论数:0

各个字符编码之间的关系

我们常见的编码格式有ASCII码,GBK,Unicode, UTF-8,现在我们来说说他们之间的关系,首先最先出现的是ASCII码表,他是占一个字节的,是一套标准的信息交换表。 GBK是国标,它的出现是为了方便使用中文的我们, GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646...

2018-11-17 09:54:54

阅读数:32

评论数:0

以字典的方式读写csv文件

#写 def write_dict(): with open('phone.csv','w')as f: writer = csv.DictWriter(f, fieldnames=("id",'na...

2018-11-14 13:14:20

阅读数:110

评论数:0

使用selenium爬取淘宝网页商品

import json from urllib.parse import quote from selenium.common.exceptions import TimeoutException from selenium import webdriver from selenium.webdr...

2018-11-10 17:19:13

阅读数:135

评论数:0

python五大基本算法之快速排序

快速排序的思想:首先选取一个基准数(一般为第一个数),然后将比它小得数放到左边,比它大的数放到右边,这一个过程称为一趟快速排序。 一趟快速排序的算法是: 1)设置两个变量i、j,排序开始的时候:i=0,j=N-1; 2)以第一个数组元素作为关键数据,赋值给key,即key=A[0]; 3)从j开始...

2018-11-02 20:44:40

阅读数:30

评论数:0

如何应用装饰器(上)

装饰器的作用就是对需要装饰的函数添加一个新的功能,其本质就是一个闭包,然后进行函数之间的调用,就是把它的功能调过来自己用,这就是所谓的装饰器。 好,下面就让我们来了解了解这个装饰器,先定义如下一个函数: def funck(): print("He...

2018-08-03 17:56:14

阅读数:28

评论数:0

一、用递归实现斐波那契函数

人理解迭代,神理解递归,这句话充分说明了递归的奥妙,递归的思想就是自己调用自己,而使用python函数能很好地实现递归。下面就用python实现斐波那契函数,代码如下: def recur_fibo(num): if num <= 1:...

2018-08-03 17:04:41

阅读数:565

评论数:2

提示
确定要删除当前文章?
取消 删除
关闭
关闭