- 博客(21)
- 资源 (28)
- 问答 (1)
- 收藏
- 关注
转载 Mysql分区表
Mysql分区表1 分区概念2 分区的优点3 分区类型4 子分区5 分区的查看和修改6 分区的影响7 各种存储引擎的分区1 分区概念分区针对不同的数据库,具有不同的特性。在这里专门针对MySQL数据库而言。在MySQL数据库里,分区这个概念是从mysql 5.1才开始提供的。不过目前只有在mysql advanced版本里才提供。分区是把数据库、或它的组成部分(比如表)分成几个小部分。而且专...
2019-06-21 19:45:11 2392
转载 python读取文件最后一行
处理文件时,一个常见的需求就是读取文件的最后一行。那么这个需求用python怎么实现呢?一个朴素的想法如下:with open('a.log', 'r') as fp: lines = fp.readlines() last_line = lines[-1]即使不考虑异常处理的问题,这个代码也不完美,因为如果文件很大,lines = fp.readlines()会造成很大的时...
2019-06-21 18:03:07 20378 1
转载 mysql中case语句的作用与实例
/*创建表c1*/CREATE TABLE c1 ( id INT, sex VARCHAR (10), score INT);/*插入数据*/INSERT INTO c1VALUES (1001, '男' ,65), (1002, '男' ,75), (1003, '女' ,82), (1004, '女' ,70), ...
2019-06-14 16:10:36 3393
转载 mysql中left join多个子查询写法以及别名用法
mysql中join多个子查询的方法,牵涉到如何正确使用子查询的别名。SELECT a.id, a.thumbNail, a. NAME, a.marketPrice, a.memberPrice, a.personName, a.status, a.recieveOrderDate, a.trackNumber, ...
2019-06-14 16:01:14 2776
转载 图像表示-HOG特征
HOG特征详解HOG:从理论到OpenCV实践这两篇博客讲得比较好,第一篇比较简洁,第二篇比较详细,联合服用效果更佳,自己的之后再整理。
2019-06-08 16:00:34 1207
转载 pandas判断和删除重复duplicated和drop_duplicates
数据清理- 重复数据判断删除1.函数df.duplicated(subset=None, keep=‘first’) # 指定列数据重复项判断;# 返回:指定列重复行boolean Seriesdf.drop_duplicates(subset=None, keep=‘first’, # 删除重复数据inplace=False) # 返回:副本或替代参数:subset=N...
2019-06-05 20:51:39 26221 3
转载 pandas.set_option
import pandas as pd1、pd.set_option(‘expand_frame_repr’, False)True就是可以换行显示。设置成False的时候不允许换行2、pd.set_option(‘display.max_rows’, 10)pd.set_option(‘display.max_columns’, 10)显示的最大行数和列数,如果超额就显示省略号,这个指...
2019-06-05 20:36:32 8395
转载 pandas的分列操作str.split()
本文主要是在pandas中如何对字符串进行切分。我们考虑一下下面的应用场景。这个是我们的数据集(data),可以看到,数据集中某一列(name)是某个行业的分类。各个行业之间用符号 ‘|’分割。我们要把用每个‘|’进行分割的内容抽取出来。pandas有个一步到到位的方法,非常方便。import pandas as pddata['name'].str.split('|',expand=...
2019-06-05 20:33:05 48772
转载 pandas中set_index和reset_index用法
1.set_indexDataFrame可以通过set_index方法, 设置dataframe的某一列或者多列作为索引,即可以设置单索引和复合索引。DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)drop:默认为true,表示是否删除作为新索引的列,默认这个列作...
2019-06-05 19:19:59 1156
转载 MySQL索引背后的数据结构及算法原理
MySQL索引背后的数据结构及算法原理1 摘要2 数据结构及算法基础2.1 索引的本质2.2 B-Tree和B+Tree2.3 为什么使用B-Tree(B+Tree)3 MySQL索引实现3.1 MyISAM索引实现3.2 InnoDB索引实现3.3 索引使用策略及优化3.3.1 示例数据库3.3.2 最左前缀原理与相关优化3.3.3 索引选择性与前缀索引3.4 InnoDB的主键选择与插入优化后...
2019-06-04 18:57:23 174
转载 海量数据处理专题(二)——Bloom Filter
1 什么是Bloom Filter布隆过滤器(Bloom Filter)是一个判断集合中是否包含特定元素的算法。比如,判断一个英文单词是否在字典中(单词拼写检查);黑名单检查等。也常用在搜索引擎中。布隆过滤器由一个很长的二进制向量和一系列随机映射函数组成。提供插入但不提供删除,但有用计数器代替bit位的变体提供删除操作。2 适用范围可以用来实现数据字典,进行数据的判重,或者集合求交集3 基...
2019-06-04 10:34:16 269
转载 海量数据处理专题(四)——Bit-map
0【什么是Bit-map】所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。如果说了这么多还没明白什么是Bit-map,那么我们来看一个具体的例子,假设我们要对0-7内的5个元素(4,7,2,5,3)排序(这里假设这些元素没有重复)。那么我们就可以采用Bit-map的方法来达到排序的目...
2019-06-03 19:49:40 205
转载 海量数据处理专题(七)——数据库索引及优化
索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。1 数据库索引1.1 什么是索引数据库索引好比是一本书前面的目录,能加快数据库的查询速度。例如这样一个查询:select * from table1 where id=44。如果没有索引,必须遍历整个表,直到ID等于44的这一行被找到为止;有了索引之后(必须是在ID这一列上建立的索引),直接在索引里...
2019-06-03 16:21:47 303
转载 操作系统必会知识
0 操作系统的作用资源管理:处理器管理、存储器管理、设备管理、文件管理和作业管理。提供接口:为用户提供使用计算机的接口。1 进程和线程以及它们的区别进程是对运行时程序的封装,是系统进行资源调度和分配的的基本单位,实现了操作系统的并发;线程是进程的子任务,是CPU调度和分派的基本单位,用于保证程序的 实时性,实现进程内部的并发;一个程序至少有一个进程,一个进程至少有一个线程,线程依赖...
2019-06-01 23:18:22 369
转载 计算机网络必备基础知识
1 计算网络的体系结构常用的是五层协议的体系结构,清晰方便实现。2 HTTP和HTTPS的区别Http协议运行在TCP之上,明文传输,客户端与服务器端都无法验证对方的身份;Https是身披SSL(Secure Socket Layer)外壳的Http,运行于SSL上,SSL运行于TCP之上,是添加了加密和认证机制的HTTP。二者之间存在如下不同:端口不同:Http与Http使用不同的连接...
2019-06-01 17:05:52 10609
创建和使用DLL的示例代码
2018-11-30
OpenCV-2.4.0-GPU-demos-pack
2018-09-05
opencv2.2版本
2018-09-05
opencv2.1版本
2018-09-05
opencv2.0版本
2018-09-05
python3安装MySQLdb需要的whl包
2018-06-12
Python Scrapy爬取ScienceNews并展示
2017-05-01
linux安装git需要的文件
2016-11-25
Hadoop windows开发bin替换文件
2016-11-17
eclipse rcp中怎么为文本框绑定复合键事件
2015-03-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人