自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

爱因斯坦的code博客

生命不息,代码不止

  • 博客(46)
  • 收藏
  • 关注

原创 python自然语言处理(二)

1.使用FreqDist需找文本中最常见的50个词>>>fdist1=FreqDist(text1)>>>fdist1FreqDist({',':18713, 'the': 13721, '.': 6862, 'of': 6536, 'and': 6024, 'a': 4569, 'to': 4542,';': 4072, 'in': 3916, 'that': 2982, ...})

2017-08-11 18:14:15 459

原创 python自然语言处理(一)

1.从NLTK的book模块加载所有东西>>>fromnltk.book import *2.词语索引视图。显示一个指定单词的每一次出现,连同上下文一起显示。>>>text1.concordance(‘monstrous’)3.通过索引看到monstrous上下文中有the_pictures和the_size,查找哪些词出现在相似上下文,可以在被查询文本名后加similar,然后括

2017-08-10 21:57:21 425

原创 python模块

1. 模块为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module)。使用模块有什么好处?最大的好处是大大提高了代码的可维护性。其次,编写代码不必从零开始。当一个模块编写完毕,就可以被其他地方引用。使用模块还可以避免函数名和变量名冲突。相同名字的函

2017-08-07 20:36:44 373

原创 python函数式编程(三)装饰器、偏函数

1. 装饰器由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。>>>def now():       print('2015-3-25')>>>f = now>>>f()2015-3-25函数对象有一个__name__属性,可以拿到函数的名字:>>>now.__name__'now'>>>f.__name__'now'

2017-08-07 18:12:43 255

原创 python函数式编程(二)返回函数、匿名函数

1. 函数作为返回值高阶函数除了可以接受函数作为参数外,还可以把函数作为结果值返回。我们来实现一个可变参数的求和。通常情况下,求和的函数是这样定义的:defcalc_sum(*args):    ax = 0    for n in args:        ax = ax + n    return ax如果不需要立刻求和,而是在后面的代码中,根据需要再计算,可以

2017-08-07 18:11:33 527

原创 python函数式编程(一)map/reduce、filter、sorted

1. 变量可以指向函数函数本身也可以赋值给变量,即:变量可以指向函数:>>>f = abs>>>f(-10)102. 传入函数既然变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数。一个最简单的高阶函数:defadd(x, y, f):    return f(x) + f(y)当我们调用add(-5,

2017-08-07 18:10:28 322

转载 谷歌论文之MapReduce(中文)

MapReduce:超大机群上的简单数据处理摘要MapReduce是一个编程模型,和处理、产生大数据集的相关实现。用户指定一个map函数处理一个key/value对,从而产生中间的key /value对集。然后再指定一个reduce函数合并所有的具有相同中间key的中间value。下面将列举许多可以用这个模型来表示的现实世界的工 作。以这种方式写的程序能自动的在大规模的普通

2017-08-06 17:22:43 410

转载 谷歌论文之Google File System(中文)

Google文件系统 GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。 1、设计概览 (1)设计想定 GFS与过去的分布式文件系统有很多相同的目标,但GFS的设计受到了当前及预期的应用方面的工作量及技术环境的驱动,这反映了它与早期的文件系统明显不同的设想。这就

2017-08-06 17:17:11 337

原创 python高级特性

1. 切片取一个list或tuple的部分元素是非常常见的操作。对这种经常取指定索引范围的操作,用循环十分繁琐,因此,Python提供了切片(Slice)操作符,能大大简化这种操作。>>> L = ['Michael', 'Sarah','Tracy', 'Bob', 'Jack']>>> L[0:3]['Michael', 'Sarah', 'Tracy']L[0:3]表示,

2017-08-06 16:48:34 252

原创 python中汉诺塔问题的求解

汉诺塔问题是源于印度一个古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆从下面开始按大小顺序重新摆放在另一根柱子上。并且规定,在小圆盘上不能放大圆盘,在三根柱子之间一次只能移动一个圆盘。(a)是初始状态,也就是递归的起点,我们假设n=4, move(4,A,B,C)(b)是step1完成的时候的

2017-08-05 19:56:18 970

原创 python函数

1. python内置了很多有用的函数,可以直接调用。abs()       求绝对值,只传入一个参数max()      接收任意多个参数,并返回最大的那个2. 数据类型转换python内置的常用函数包括数据类型转换函数。int()        可以把其它数据类型转换为整数float()      把其它数据类型转换为浮点数str()        把其它数据类型转

2017-08-05 19:23:50 933 1

原创 python基础(七)set

set和dict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key。要创建一个set,需要提供一个list作为输入集合: 》s = set([1, 2, 3]) 》 s {1, 2, 3} 注意,传入的参数[1, 2, 3]是一个list,而显示的{1, 2, 3}只是告诉你这个set内部有1,2,3这3个元素,显示的顺序也不表示set是

2017-08-04 22:59:18 225

原创 python基础(六)dict

Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 》 d = {‘Michael’: 95, ‘Bob’: 75, ‘Tracy’: 85} 》d[‘Michael’] 95为什么dict查找速度这么快?因为dict的实现原理和查字典是一样的。假设字典包含了1万个汉字,我们要查某一个

2017-08-04 22:57:18 308

原创 python基础(五)循环

for x in …循环就是把每个元素代入变量x,然后执行缩进块的语句 依次把list或tuple中的每个元素迭代出来 names = [‘Michael’, ‘Bob’, ‘Tracy’] for name in names: print(name) 计算1-10的整数之和,可以用一个sum变量做累加 sum = 0 for x in [1, 2, 3, 4, 5, 6, 7, 8,

2017-08-04 22:55:58 374

原创 python基础(四)条件判断

1.输入用户年龄,根据年龄打印不同的内容 age = 20 if age >= 18: print(‘your age is’, age) print(‘adult’) 再添加一个else语句 age = 3 if age >= 18: print(‘your age is’, age) print(‘adult’) else: print(‘y

2017-08-04 22:55:04 366

原创 python基础(三)tuple

除了list,还有一种有序列表叫元组:tuple。tuple和list非常类似,但是tuple一旦初始化就不能修改,没有append(),insert()这样的方法。 列出同学名字 classmates = (‘Michael’, ‘Bob’, ‘Tracy’)如果定义一个空的tuple t=() 因为括号()既可以表示tuple,又可以表示数学公式中的小括号,为避免歧义,定义一个元素

2017-08-04 22:53:50 187

原创 python基础(二)list

1.Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。 列出班上所有学生的名字 classmates = [‘Michael’, ‘Bob’, ‘Tracy’] 变量classmates就是一个list,用len(),可获得元素个数 用classmates[n]索引,n从0开始。写[-n]可获得倒数第n个元素 2. list是一个可变的

2017-08-04 22:50:50 254

原创 python基础(一)数据类型和变量

python可直接处理的数据类型:整数、浮点数、字符串、布尔值、空值整数如数学表示,若十六进制可写作0xff00之形式浮点数中科学计数法,1.23e9表示1.23x109字符串表示中为表示’ “可用转义字符\’或\”字符串中可用’\n’换行变量可以是整数、字符串、布尔值python中变量是动态语言,无需指定赋值的数据类型常量,通常用全部大写的变量名表示/除法结果一定是浮点数,//地板

2017-08-04 22:49:52 280

原创 关于Subline text3的input问题

使用input时,需要安装SublimeREPL插件才可以输入然后得到结果 关于如何安装SublimeREPL: 1.按ctrl+shift+p,输入install package,回车选择,然后搜索sublimerepl选择并安装 2.在要运行的文件上,选择Tools -> SublimeREPL -> Python -> RUN current file,这时候已经支持输入了数据了 3.

2017-08-04 21:08:52 624

原创 详解Uncoide、ASCII、UTF-8

因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295。 由于计算机是美国人发明的,因此,最早

2017-08-04 17:51:08 962

原创 MYSQL学习笔记(二十五)数据库维护

备份数据 (1) 使用命令行实用程序mysqldump转储所有数据库内容到某个外部文件; (2) 可用命令行实用程序mysqlhotcopy从一个数据库复制所有数据; (3) 可使用MYSQl的BACKUP TABLE或SELECT INTO OUTFILE转储所有数据到某个外部文件。这两条语句都接受将要创建的系统文件名,此系统文件必须不存在,否则会出错。数据可以用RESTORE TABLE来

2017-07-30 22:08:48 287 1

原创 MYSQL学习笔记(二十四)安全管理

访问控制 给用户提供他们所需的访问权,且仅提供他们所需的访问权 在现实工作中,不能使用root,应创建一系列账号,有的用于管理,有的供用户使用,有的供开发人员使用管理用户 MYSQL用户账号和信息存储在名为mysql的MYSQL数据库中。 直接访问时: USE mysql; SELECT user FROM user;创建用户账号 CREATE USER 本 INDETIFIED

2017-07-30 22:07:56 207

原创 MYSQL学习笔记(二十三)字符集和校对

1. 几个重要术语 字符集:字母和符号的集合 编码:某个字符集成员的内部表示 校对:规定字符如何比较的指令 2. 字符集、校对的查看 SHOW CHARACTER SET; 显示所有可用字符集以及每个字符集的描述和默认校对 SHOW COLLATION; 显示所有可用的校对,以及它们适用的字符集 SHOW VARIABLES LIKE ‘

2017-07-30 22:05:22 181

原创 MYSQL学习笔记(二十二)管理事务处理

事务处理 事务处理可以用来维护数据库的完整性,它保证成批的MYSQL操作要么完全执行,要么完全不执行事务处理几个术语 事务:指一组SQL语句 回退:指撤销指定SQL语句的过程 提交:指将未存储的SQL语句结果写入数据库表 保留点:指事务处理中设置的临时占位符,可以对它发布回退事务开始 START TRANSACTION使用ROLLBACK 此命令用来回退(撤销)MYSQL语句

2017-07-29 15:56:32 212

原创 MYSQL学习笔记(二十一)使用触发器

触发器 触发器是MYSQL响应以下任意语句而自动执行的一条MYSQL语句:DELETE、INSERT、UPDATE创建触发器 CREATE TRIGGER newproduct AFTER INSERT ON products FOR EACH ROW SELECT ‘Product added’; CREATE TRIGGER用来创建名为newproduct的新触发器 AFTER IN

2017-07-29 15:55:51 303

原创 MYSQL学习笔记(二十)使用游标

游标 游标是一个存储在MYSQL服务器上的数据库查询,它不是一条SELECT语句,而是被该语句检索出来的结果集。 游标主要用于交互式应用,其中用户需要滚动屏幕上的数据,并对数据浏览或更改。 MYSQL游标只能用于存储过程(和函数)使用游标的步骤: (1) 在能够使用游标前,必须声明(定义)它。此时未检索,只是定义要用SELECT语句 (2) 声明后,打开游标以供使用 (3) 对于天有数

2017-07-29 15:54:46 330

原创 MYSQL学习笔记(十九)使用存储过程

存储过程 存储过程就是为以后使用而保存的一条或多条SQL语句存储过程的应用 (1)通过把处理封装在一个易用的单元中,可以简化复杂的操作。 (2)由于不要求反复建立一系列处理步骤,因而保证了数据的一致性。如果所有开发人员和应用程序都使用同一存储过程,则所使用的代码都是相同的。这一点的延伸就是防止错误。需要执行的步骤越多,出错的可能性就越大。防止错误保证了数据的一致性。 (3)简化对变动的管理

2017-07-28 21:11:33 257

原创 MYSQL学习笔记(十八)使用视图

视图 视图是虚拟的表。与包含数据的表不一样,视图只包含使用时动态检索数据的查询视图的应用 (1)重用SQL语句。 (2)简化复杂的SQL操作。在编写查询后,可以方便地重用它而不必知道其基本查询细节。 (3)使用表的一部分而不是整个表。 (4)保护数据。可以授予用户访问表的特定部分的权限,而不是整个表的访问权限。 (5)更改数据格式和表示。视图可返回与底层表的表示和格式不同的数视图的规

2017-07-28 21:10:05 278

原创 MYSQL学习笔记(十七)创建和操纵表

创建表的两种方法 使用交互式创建和管理表的工具 直接用MYSQL语句操纵表创建基础 CREATE TABLE Products ( prod_id int NOT NULL, vend_id char10) NOT NULL, prod_name char(254) NOT NULL, prod_price decimal(8,2) NOT NULL, prod_

2017-07-27 17:16:11 285

原创 MYSQL学习笔记(十六)更新和删除数据

更新数据 UPDATE Customers SET cust_email = ‘kim@thetoystore.com’, cust_name=’The Fudds’ WHERE cust_id = ‘1000000005’; UPDATE后接要更新的表名,SET用新值覆盖该列旧值,WHERE用来指定行 更新多个列时只需要使用单个SET命令,每个”列=值”之间用逗号分隔 为即使

2017-07-26 17:33:51 312

原创 MYSQL学习笔记(十五)数据插入

插入完整的行 INSERT INTO Customers(cust_id, cust_name, cust_address, cust_city, cust_state, cust_zip, cust_country, cust_contact, cust_email) VALUES(‘1000000006’, ‘Toy Land’, ‘123 Any Street’, ‘

2017-07-26 17:32:56 361

原创 MYSQL学习笔记(十四)使用全文本搜索

1. 启用全文本搜索支持在CREATE TABLE语句创建表时,使用FULLTEXT;也可在稍后指定(所有已有数据必须立即索引)2. 进行全文本搜索SELECT ——FROM ——WHERE Match(——) Against(‘——’);Match指示针对指定的列进行搜索,Against指定其括号里的词作为搜索文本传递给Match()的值必须与FULLTEXT()定义

2017-07-25 17:35:56 388

原创 MYSQL学习笔记(十三)组合查询

创建组合查询 SELECT ——,——,—— FROM —— WHERE ——<=m UNION SELECT ——,——,—— FROM —— WHERE —— IN (——,——); 这条语句由两条SELECT语句组成,语句中用UNION关键字分隔 执行多个查询,并将结果作为单个查询结果集返回UNION规则 (1) 两条或两条以上SELECT语句组成,语句之间用UNION分

2017-07-25 16:30:43 269

原创 MYSQL学习笔记(十二)创建高级联结

使用表别名 SELECT ——,—— FROM —— AS c,—— AS o,—— AS oi WHERE c.——=o.—— AND oi.——=o.—— AND ——=——; 此处给表别名,三个例名,c、o、oi,可随意替换其他字符。可缩短SQL语句 表别名可用于WHERE子句,SELECT列表,ORDER BY子句等 与列别名不同,表别名只存在于查询执行中使用不同类

2017-07-25 16:06:11 197

原创 MYSQL学习笔记(十一)联结

外键 外键为某个表中的一列,它包含另一个表的主键值,定义了两个表的关系创建联结 SELECT ——,——,—— FROM ——,—— WHERE ——=——; 此SELECT语句与之前最大不同在于SELECT中三个空可来自不同的表 FROM给出多个表,这些表通过WHERE语句进行联WHERE子句重要性 WHERE子句作为过滤条件,只包含那些匹配给定联结条件的行,而不是对每一行进行配

2017-07-24 16:50:46 217

原创 MYSQL学习笔记(十)使用子查询

利用子查询进行过滤 SELECT ——,—— FROM —— WHERE —— IN (SELECT —— FROM —— WHERE —— IN (SELECT —— FROM ——) WHERE ——=——); 在SELECT语句,子查询总是从内向外处理 作为子查询的SELECT语句只能查询单个列 虽然子查询一般与IN操作符结合使用,但也可用于测试等于

2017-07-24 16:02:34 199

原创 MYSQL学习笔记(九)分组数据

创建分组 SELECT ——,COUNT(*) AS —— FROM —— GROUP BY ——; 得到SELECT之后该空对应的数据行数 GROUP BY子句指示按其后面的空排序并分组数据 GROUP BY子句必须出现在WHERE子句之后、ORDER BY子句之前过滤分组 SELECT ——,COUNT(*) AS —— FROM —— GROUP BY —— HAVING

2017-07-23 21:49:58 214

原创 MYSQL学习笔记(八)汇总数据

聚集函数 运行在行组上,计算和返回单个值的函数 (1) AVG()函数 AVG()用来返回所有列的平均值或特定列或行的平均值 SELECT AVG(——) AS —— FROM —— WHERE ——=——; 只能用于单个列,未获得多个列的平均值,必须使用多个AVG()函数 (2) COUNT()函数 COUNT()用来确定表中行的数目或符合特定条件的行的数目 SELECT CO

2017-07-23 16:45:45 266

原创 MYSQL学习笔记(七)使用数据处理函数

文本处理函数 Left() 返回串左边的字符 Right() 返回串右边的字符 Lower() 将串转换为小写 Upper() 将串转换为大写 LTrim() 去掉串左边的空格 RTrim() 去掉串右边的空格 Length() 返回串的长度 Locate()

2017-07-22 21:16:16 205

原创 R学习笔记(一)数据结构

1.向量 向量是用于存储数值型、字符型或逻辑型数据的一维数组。执行组合功能的函数c()可用来创建向量 第一行表示创建a向量,其中包含多个字符 第二行找到a向量中第3个字符 第四行找到a向量中第1,3,5个字符 第六行找到a向量中从第2到第6个字符 2. 矩阵 矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数matrix()创建矩阵 my

2017-07-22 20:21:07 1121

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除