自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 资源 (9)
  • 收藏
  • 关注

原创 python使用xlrd模块读写Excel文件的方法

python使用xlrd模块读写Excel文件的方法一、安装xlrd模块到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。二、使用介绍1、导入模块 import xlrd2、打开Excel文件读取数据 data = xlrd.open_workbook('excelFile.xls')3、使用技巧 获取一个工作表 t

2016-09-30 14:12:46 1332

原创 【机器学习理论】信息熵

熵可以理解为信息量,而信息量又可以理解为随机性。若不确定性越大,则信息量越大,熵越大;若不确定性越小,则信息量越小,熵越小。熵的计算公式: 一个系统越是有序,信息熵就越低;一个系统越是混乱,信息熵就越高。

2016-09-28 10:20:12 755

原创 Python数据可视化:幂律分布

1、公式推导 对幂律分布公式: 对公式两边同时取以10为底的对数: 令,且为常数,所以公式变为: 所以对于幂律公式,对X,Y取对数后,在坐标轴上为线性方程。2、可视化 从图形上来说,幂律分布及其拟合效果: 对X轴与Y轴取以10为底的对数。效果上就是X轴上1与10,与10与100的距离是一样的。 对XY取双对数后,坐标轴上点可以很好用直线拟合。所以,判定数据是否符合幂律分

2016-09-27 23:28:12 25316 8

原创 Python数据可视化:饼状图

使用python实现论文里面的饼状图:原图: python代码实现: # # 饼状图 # plot.figure(figsize=(8,8)) labels = [u'Canteen', u'Supermarket', u'Dorm', u'Others'] sizes = [73, 21, 4, 2] colors = ['red', 'yellow', '

2016-09-27 23:12:45 52076 7

原创 Python数据可视化:泊松分布

一个服从泊松分布的随机变量X,表示在具有比率参数(rate parameter)λ的一段固定时间间隔内,事件发生的次数。参数λ告诉你该事件发生的比率。随机变量X的平均值和方差都是λ。 代码实现: # Poisson分布 x = np.random.poisson(lam=5, size=10000) # lam为λ size为k pillar = 15 a = pl

2016-09-27 15:29:14 29910 4

原创 Python数据可视化:中心极限定律

中心极限定理是研究独立随机变量和的极限分布为正态分布的问题。设随机变量序列 相互独立,均具有相同的数学期望与方差,即 令: 则称随机变量为随机变量序列的规范和。中心极限定理:设从均值为、方差为;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为 的正态分布。【定理1】:(独立同分布的中心极限定理) 设随机变量 相互独立,具有相同的分布, 记:

2016-09-27 14:18:51 4617

原创 Python数据可视化:正态分布(高斯分布)

正态分布(Normal distribution)又成为高斯分布(Gaussian distribution)若随机变量X服从一个数学期望为、标准方差为的高斯分布,记为: 则其概率密度函数为: 正态分布的期望值决定了其位置,其标准差决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是的正态分布: 概率密度函数 代码实现: # Python实现

2016-09-27 11:19:31 53123 2

原创 【scikit-learn】05:sklearn文本分类及评价指标

今天看到一句话: 你能留给岁月的,岁月能留给你的,除了一个更好的自己,别无其他。还能什么比这更能激励自己学习呢?在windows下安装sklearn,直接下载winpython安装就行了。自行选择32或64位。 http://sourceforge.net/projects/winpython/后面本文都把sklearn简称sk。sk已经自带了一些数据集,先看iris和digits:fro

2016-09-23 14:44:00 7909 1

原创 【scikit-learn】07:数据加载,数据归一,特征选择,逻辑回归,贝叶斯,k近邻,决策树,SVM

引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python3.x在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。

2016-09-23 11:51:15 5799 1

原创 【scikit-learn】06:make_blobs聚类数据生成器

make_blobs聚类数据生成器简介scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。make_blobs方法:sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, clu

2016-09-22 14:49:04 38834 5

原创 【超强教程】python在64位操作系统下的安装

1、安装python-2.7.12.amd64.msi: Python的官网下载地址:https://www.python.org/download/ 2、直接双击安装,选择环境搭建,这样在python安装完成之后就不需要再搭建环境了3、pip安装: Python安装pip之前需要安装一个叫做ez_setup.py的程序 ez_setup.py程序网址在这里https://pypi.

2016-09-22 01:04:58 9283

原创 【Java数据结构与算法】| 数组--天平称量问题

天平称量问题题目:有12枚硬币,其中有1枚是假币,但不知道是重是轻。现给定衣架没有砝码的天平,问至少需要多少次称量才能找到这枚硬币?思考:如何证明某个方案是最少次数?解析:随机将12枚硬币等分成3份,每份4枚;标记为A,B,C三份。将A放在左侧,B放在右侧,用天平称量A和B,分三种情况:1、天平平衡 2、A(左)比B(右)重 3、A(左)比B(右)轻(这两种情况一样的)分析:1、天平平衡天平平

2016-09-20 22:46:04 1158

原创 【Java数据结构与算法04】 | 第2章--小结

大O表示法: 用“大O表示法”来评价计算机算法的效率。 算法 大O表示法 线性查找 O(n) 二分查找 O(logn) 无序数组的插入 O(1) 有序数组的插入 O(N) 无序数组的删除 O(N) 有序数组的删除 O(N)小结:Java中的数组是对象,由new操作符创建无序数组可以提供快速的插入,但查找和删除较慢将数组封装到类中可以保护

2016-09-20 09:38:57 439

原创 【Java数据结构与算法04】 | 第2章--数组

插入、查找和删除 … 不允许重复 允许重复 查找 N/2次比较 N次比较 插入 无比较,一次移动 无比较,一次移动 删除 N/2次比较,N/2次移动 N次比较,N/2次移动//数组的创建package Array;public class ArrayCreate { public static void main(String[] args)

2016-09-20 09:28:20 369

原创 【Java数据结构与算法03】 | 第1章--小结

小结:数据结构是指数据在计算机内存空间中或磁盘中的组织形式正确选择数据结构会使程序的效率大大提高数据结构的例子有数组、栈和链表算法是完成特定任务的过程在Java中,算法经常通过类的方法来实现数据库是指由许多类似的记录组成的数据存储的集合一条记录表示现实世界的一个事物一条记录被分成字段,每个字段都存储了由这个记录所描述事物的一条特性一个关键字是一条记录中的一个字段,通过它可以对数据执

2016-09-14 16:53:42 333

原创 【Java数据结构与算法02】 | 第1章--面向对象(double精度计算问题)

在这个程序中遇到double运算精度的问题,首先贴出代码:package Introduction;public class BankAccount { private double balance; public BankAccount(double openingBalance){ balance = openingBalance; } public

2016-09-14 16:44:40 448

原创 【Java数据结构与算法01】 | 第1章--综述(Java与C++区别)

数据结构包括数组、链表、栈、二叉树、哈希表等。数据结构的特性 数据结构 优点 缺点 数组 插入快,如果知道下标,可以非常快的存取 查找和删除慢,大小固定 有序数组 比无序的数组查找快 删除和插入慢,大小固定 栈 提供后进先出方式的存取 存取其他项很慢 队列 提供先进先出方式的存取 存取其他项很慢 链表 插入快,删除快 查找慢

2016-09-13 23:04:01 679

原创 Word中插入代码块

在Word中将代码块显示出来:方法: 1、创建一个表格 2、将代码复制到表格中 3、设置表格的背景为灰色,无边框形式

2016-09-13 16:39:21 31045 4

原创 数据结构与算法分析 | 01 | 引论

package Introduction;/* * @author kevinelstri * * 引论<1.1> * * 求一组N个数中的最大值 * * 方法1:将这N个数读进一个数组中,再通过某种简单的算法进行排序,获取最大值 * 方法2:先把前k个元素读入某一数组中并对其进行排序,将剩下的元素逐个读入,与已经 * 排序的元素进行比较,获取

2016-09-12 17:58:35 476

原创 codeblocks中文乱码解决

1、codeblocks下载 2、编译器配置 Settings -> Compile -> 点击Auto-detect,重新获取编译地址3、中文乱码解决 Settings -> Editor -> Settings -> Compile ->       在other options里面加入:             -finput-charset=WINDOWS-936

2016-09-12 10:59:05 1110 1

转载 2014年计算机求职总结--面试篇

又一年实习招聘陆续开始了,这里分享一下我在2013年实习招聘和秋季招聘中的一些面试经历,希望能对找工作的同学有所帮助。2013年面试过的公司有蘑菇街、网易游戏、阿里巴巴、腾讯、百度、大众点评、人人网、雅虎(北研)、WAP。一、蘑菇街一面(实习)现场面试。先问了一下实习经历以及研究生期间做的项目,面试前一定要好好回顾一下这些。因为我申请的是搜索引擎和存储方向,就问了我对大数据的理解。还问了一下为什么读

2016-09-04 12:44:59 477

转载 2014年计算机求职总结--准备篇

版权所有,转载请注明出处,谢谢! http://blog.csdn.net/walkinginthewind/article/details/13000431 找工作是一个长期准备的过程,突击是没什么效果的。准备时间越长,准备就越充分,就越容易拿到好的offer。我基本上从研究生一入学就一直在准备找工作的东西,看书、研究研究笔试面试题、在线编程训练、参加实习招聘等等。当然,其实主要还是研二开始准

2016-09-04 12:42:33 358

原创 【MySQL 14】触发器after和before

after是先完成数据的增删改,再触发,触发的语句晚于监视的增删改操作,无法影响前面的增删改动作;也就是说先插入订单记录,再更新商品的数量;before是先完成触发,再增删改,触发的语句先于监视的增删改,我们就有机会判断,修改即将发生的操作;案例: 商品 g 表中 juzi 的数量只有20个,但是如果在订单o中加入超过20了,此时如何解决呢?

2016-09-03 16:34:05 617

原创 【MySQL 13】数据库设计

信息系统从立项到上线运行需要经历需求分析、系统分析、系统实现、维护 4个阶段。数据库设计的基本步骤: 1、需求收集与分析 2、概念结构设计 3、逻辑结构设计 4、物理结构设计 5、实施、运行和维护 ER 图:实体-联系图(Entity-Relation Diagram)用来建立数据模型,在数据库系统概论中属于概念设计阶段,ER图提供了表示实体(即数据对象)、属性和联系的

2016-09-03 15:43:56 728

原创 【MySQL 12】触发器

触发器是一种特殊类型的存储过程,它不同于之前的我们介绍的存储过程。触发器主要是通过事件进行触发被自动调用执行的。而存储过程可以通过存储过程的名称被调用。       触发器的主要作用就是能够实现比参照完整性更为复杂的两张表或多张表之间的数据的完整性和一致性,从而保证表中的数据的变化符合数据库设计者确定的业务规则。       触发器对表进行插入、更新、删除的时候会自动执行的特殊存储过程。

2016-09-03 15:10:50 474

原创 【MySQL 11】注释

对mysql代码进行阅读的时候,发现需要添加注释:mysql注释符有三种: 1、#… 2、”- - …” 3、/…/依次测试:1、#…mysql> select * from person; #chazhao+----+------+------+------+-----------+| id | name | sex | age | addr |+--

2016-09-03 13:14:03 569

原创 【MySQL 10】游标

数据库中,对数据的处理分为两种方式:       一种是基于数据行集合的整体处理方式,直接使用select、update、delete等语句来操作(select语句直接查询某一整列);        一种是逐行处理数据行的方式,游标就是这种数据访问机制,允许用户一次访问单个数据行,而非整个数据行集(游标在某一列中进行一行一行查询)。一、创建数据表mysql> select * fro

2016-09-03 11:18:30 410

原创 【MySQL 09】常用函数

1、数学函数 ABS(x) 返回x的绝对值 BIN(x) 返回x的二进制(OCT返回八进制,HEX返回十六进制) CEILING(x) 返回大于x的最小整数值 EXP(x) 返回值e(自然对数的底)的x次方 FLOOR(x) 返回小于x的最大整数值 GREATEST(x1,x2,…,xn)返回集合中最大的值 LEAST(x1,x2,…,xn)

2016-09-01 21:14:00 556

原创 【MySQL 08】存储过程

首先,对于SQL的存储过程,就类似于Java里面的定义方法,调用方法。1、创建存储过程mysql中,存储过程的基本形式:CREATE PROCEDURE sp_name ([proc_parameter[,...]]) [characteristic ...] routine_body sp_name参数是存储过程的名称; proc_parameter表

2016-09-01 20:49:22 737

原创 【MySQL 07】数据库恢复技术

1、四种故障事务故障、系统故障、介质故障、计算机病毒 1、事务故障:事务内部故障可分为预期的和非预期的,其中大部分的故障都是非预期的。预期的事务内部故障是指可以通过事务程序本身发现的事务内部故障;非预期的事务内部故障是不能由事务程序处理的,如运算溢出故障、并发事务死锁故障、违反了某些完整性限制而导致的故障等。 2、系统故障:系统故障也称为软故障,是指数据库在运行过程中,由于硬件故障、数

2016-09-01 17:12:13 1019

原创 【MySQL 06】事务处理

1、事务的ACID性质事务具有4个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持续性(Durablility)。以“银行转帐”为例: 原子性(Atomicity):组成事务处理的语句形成了一个逻辑单元,不能只执行其中的一部分。换句话说,事务是不可分割的最小单元。比如:银行转帐过程中,必须同时从一个帐户减去转帐金额,并加到另一个帐户中,

2016-09-01 16:12:03 819

ourbestModel_highscore3500

斯坦福大学的学生基础性地教导系统去了解和回应自然语言提示,例如“climb down the ladder”或“get the key”,从而使该系统成为OpenAI gym中的最高评分算法。可以点击算法视频观看算法演示。 http://mp.weixinbridge.com/mp/wapredirect?url=https://drive.google.com/file/d/0B2ZTvWzKa5PHSkJvQVlsb0FLYzQ/view&action=appmsg_redirect&uin=Nzk3MTk3MzIw&biz=MzA5MzQwMDk4Mg==&mid=2651042109&idx=1&type=1&scene=0

2019-04-14

《大规模基于构件的软件开发》PDF版本

csdn中有很多这本书的版本,但全部都是pdg超星下载的,这个是带目录标签的PDF完全版,真实有效,绝不虚假!

2018-09-08

tensorflow api 英文版

tensorflow api 英文版, 高清版。。。。。。。。。。。

2018-02-09

tensorflow_whitepaper2015

tensorflow whitepaper2015, google paper 。。。。

2018-02-09

停用词表stopwords

文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)http://blog.csdn.net/kevinelstri/article/details/70227981

2017-08-15

文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)

综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981

2017-04-18

聚类内部评价标准--IEEE论文

2010IEEE论文,聚类内部评价标准

2017-03-14

股票数据集

股票数据集,google扒下来的

2017-03-13

MP3的多媒体文件结构

mp3由头部和数据构成,mp3格式也是压缩比率最大的格式,它将音频中75%到90%人类听不到的声音全部过滤掉了,音频质量也就不能很高了

2017-03-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除