- 博客(32)
- 资源 (15)
- 收藏
- 关注
转载 Python列表解析配合if else
用习惯列表解析之后会觉得超级酷,所以在尝试使用列表解析,把循环什么的写在一行里面。使用if的时候什么时候必须要有else,什么时候可以没有else一直没搞明白,直到今天!待我缓缓道来:# 当if放在判断条件里面的时候不需要配合else# 原始写法list_b = []for item in list_a: if item > 5: list_b.append(it
2017-05-30 11:36:54 38545 4
转载 Quorom机制
Quorom 机制,是一种分布式系统中常用的,用来保证数据冗余和最终一致性的投票算法,其主要数学思想来源于鸽巢原理。 什么是鸽巢原理? 其中一种简单的表述法为: 若有n个笼子和n+1只鸽子,所有的鸽子都被关在鸽笼里,那么至少有一个笼子有至少2只鸽子。 另一种为: 若有n个笼子和kn+1只鸽子,所有的鸽子都被关在鸽笼里,那么至少有一个笼子有至少k+1只鸽子。
2017-05-26 21:25:28 1673
转载 一致性哈希算法(consistent hashing), p2p关键技术
一致性 hash 算法( consistent hashing )张亮consistent hashing 算法早在 1997 年就在论文 Consistent hashing and random trees 中被提出,目前在cache 系统中应用越来越广泛;1 基本场景比如你有 N 个 cache 服务器(后面简称 cache ),那么如何将一个对象 object 映射到
2017-05-26 20:38:10 18343
原创 C++字符串数组
字符串数组的使用:1. 字符串数组的定义: 指针 + 一维数组: const char* season[] = { "Spring", "Summer", "Fall", "Winter" }2. 调用字符串数组中的每一个字符。season[0] = "Spring";// chapter7.8.cpp : Defines the entry point for the co
2017-05-24 22:08:26 18015 1
原创 磁盘中存取信息的最小单位是?
从应用程序包括用户界面的角度来看,存取信息的最小单位是Byte(字节);从磁盘的物理结构来看存取信息的最小单位是扇区,一个扇区是512字节;从操作系统对硬盘的存取管理来看,存取信息的最小单位是簇,簇是一个逻辑概念,一个簇可以是2、4、8、16、32或64个连续的扇区。一个簇只能被一个文件占用,哪怕是只有1个字节的文件,在磁盘上存储时也要占用一个簇,这个簇里剩下的扇区是无用的。例
2017-05-24 15:36:19 18760 2
转载 机器学习 - SVD分解
在网上看到有很多文章介绍SVD的,讲的也都不错,但是感觉还是有需要补充的,特别是关于矩阵和映射之间的对应关系。前段时间看了国外的一篇文章,叫A Singularly Valuable Decomposition The SVD of a Matrix,觉得分析的特别好,把矩阵和空间关系对应了起来。本文就参考了该文并结合矩阵的相关知识把SVD原理梳理一下。 SVD不仅是一个数学问题,在工程应
2017-05-23 02:38:54 609
转载 局部敏感哈希算法
阅读目录1. 基本思想2. 局部敏感哈希LSH 3. 文档相似度计算 局部敏感哈希(Locality Sensitive Hashing,LSH)算法是我在前一段时间找工作时接触到的一种衡量文本相似度的算法。局部敏感哈希是近似最近邻搜索算法中最流行的一种,它有坚实的理论依据并且在高维数据空间中表现优异。它的主要作用就是从海量的数据中挖掘出相似的数据,可以具体应用到
2017-05-22 11:31:52 1659
转载 cin.get,cin.clear()
1.cin.get() 实质:类istream所定义对象cin的重载成员函数 用于读取单字符 istream& get(char&) int get(void) 用于读取字符串 istream &get(char*,int) istream &get(char*,int,char)1.1 istream& get(char&) Point1 返回一个
2017-05-22 02:58:56 799
转载 C++ 控制台cin无法输入
先看今天的代码,我要先从控制台输入一个整数n,再输入n个字符串。[cpp] view plaincopyprint?// NO2.cpp// 展示一个C++控制台输入的错误。// 作者:曾赛#include #include int main(){using std::cout;using std::c
2017-05-22 01:03:30 8181
转载 numpy数组拼接
数组拼接方法一思路:首先将数组转成列表,然后利用列表的拼接函数append()、extend()等进行拼接处理,最后将列表转成数组。示例1:>>> import numpy as np>>> a=np.array([1,2,5])>>> b=np.array([10,12,15])>>> a_list=list(a)>>> b_list=list(b)>>> a_l
2017-05-21 15:38:35 1651
转载 DataFrame和numpy中神奇的广播函数
numpy的神奇广播函数在使用pandas的时候,一般来说对两个DataFrame(简写df)的加减乘除,会自动索引对齐,很方便,DataFrame与Series之间的运算也会沿着指定的轴进行广播。最为人称道的广播形式大概就是apply和applymap这样的操作了,很方便,很强大。 但是也有不能满足需求的时候,比如一个DataFrame根据另一个DataFrame对应的元素进行自定义
2017-05-20 23:09:56 5520 1
转载 numpy广播
Numpy的Universal functions 中要求输入的数组shape是一致的,当数组的shape不想等的时候,则会使用广播机制,调整数组使得shape一样,满足规则,则可以运算,否则就出错 。广播:对形状不同的数组,采取的运算操作。但被操作的数组中必须至少有一个某轴长度为1;或者缺少一个维度(这时候会自动补全)。换句话说,通过对两个数组中的一个或者多个在行、列上进行复制元素扩
2017-05-20 22:36:21 1651 2
转载 Python爬取新东方考研真题
要考研,想看看各个院校的真题,网上找了下,发现新东方真题库里面的考研真题还挺齐全的,网址:http://new.bj.xdf.cn/zhentiku/daxue/kaoyan/kyzyk/list_381_1.html于是随手写了个爬虫爬取所有 新闻学 的考研题,脚本如下:from urllib import urlopenfrom bs4 import BeautifulSoup
2017-05-19 20:12:27 1428 1
转载 cin输入类型与数据类型不符检查
istream类重载了抽取运算符> 支持c++内置的所有基本数据类型。cin对象将标准输入表示为字节流,然后根据抽取 运算符 不同版本的抽取运算符查看输入流的方法是相同 的。如果输入的前面一部分字符为空白(空格、换行符、和制表符),他们会跳过,直到遇到非空白字符。当输入没有满足程序期望的时候,比如对于一个int类型的变量a,却输入字符H,这种情况下,抽取运算发将不会改变变量a的
2017-05-17 01:28:12 7006
转载 Python字典排序
字典排序在程序中使用字典进行数据信息统计时,由于字典是无序的所以打印字典时内容也是无序的。因此,为了使统计得到的结果更方便查看需要进行排序。Python中字典的排序分为按“键”排序和按“值”排序。按“值”排序按“值”排序就是根据字典的值进行排序,可以使用内置的sorted()函数。 sorted(iterable[, cmp[, key[, reverse]]])
2017-05-16 00:18:37 361
原创 C++ getline
getline(istream &in, string &s)从输入流读入一行到string s•功能:–从输入流中读入字符,存到string变量–直到出现以下情况为止:•读入了文件结束标志•读到一个新行•达到字符串的最大长度–如果getline没有读入字符,将返回false,可用于判断文件是否结束cin.getline(数组名, 数组大小)从输
2017-05-15 01:56:35 699
转载 机器学习 - 卷积神经网络CNN初解
自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-convnet2。为了增进CNN的理解和使用,特写此博文,以其与人交流,互有增益。正文之前,先说几点自己对于CNN的感触。先明确一点就是,Deep Learning是全部深度学习算法的总称,CNN是深度学习算法在图像处
2017-05-15 00:16:32 1568
转载 机器学习 - 奇异值分解(SVD)
【简化数据】奇异值分解(SVD)转自:http://blog.csdn.NET/u012162613/article/details/422142051、简介奇异值分解(singular Value Decomposition),简称SVD,线性代数中矩阵分解的方法。假如有一个矩阵A,对它进行奇异值分解,可以得到三个矩阵:这三个矩
2017-05-14 15:04:28 507
转载 数组指针与指针数组
1、数组指针(指向数组的指针)(1)数组在内存中的表示创建一个数组就是在内存里面开辟一块连续的空间,比如int a[4];就是在内存里面开辟了一个大小为4*sizeof(int)字节的内存空间。二维数组是特殊的一维数组。先来看一段代码:[cpp] view plain copyvoid main() { i
2017-05-14 01:04:24 378
转载 Java UDP网络编程
UDP简介1.UDP 是User Datagram Protocol的简称, 中文名是用户数据报协议,是OSI(Open System Interconnection,开放式系统互联) 参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务,IETF RFC 768是UDP的正式规范。UDP在IP报文的协议号是17。 UDP协议全称是用户数据报协议,在网络中它与TCP协议一
2017-05-12 18:16:47 438
转载 java UDP网络编程
/** *UDPServer *@author Winty [email protected] *@version 2008-12-15 */import java.io.*;import java.net.*;class UDPServer{ public static void main(String[] args)throws IOException{
2017-05-12 18:15:41 624
转载 C++ cout字符数组和普通数组
int ab[10] = {1,2,3,6,7};char a[6] = {'h','a','p','p','y','\0'};char ac[] = "happy";cout<<ac<<endl;cout<<ac<<endl;cout<<ab<<endl;字符数组是可以用这种方式输出的,因为数组名即代表首地址,数组是一块连续的内存空间,所以能直接输出.如果是其他类型的数组则输出的是一
2017-05-12 02:18:27 16274 2
转载 C++ new的用法
new int; //开辟一个存放整数的存储空间,返回一个指向该存储空间的地址(即指针) new int(100);//开辟一个存放整数的空间,并指定该整数的初值为100,返回一个指向该存储空间的地址 new char[10];//开辟一个存放字符数组(包括10个元素)的空间,返回首元素的地址 new int[5][4];//开辟一个存放二维整型数组(大小为5*
2017-05-12 01:45:17 935
转载 机器学习 - xgboost调参
xgboost入门与实战(原理篇)前言:xgboost是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包,比常见的工具包快10倍以上。在数据科学方面,有大量kaggle选手选用它进行数据挖掘比赛,其中包括两个以上kaggle比赛的夺冠方案。在工业界规模方面,xgboost的分布式版本有广泛的可移植性,支持在YARN, MPI, Su
2017-05-10 18:49:35 2993
转载 matplotlib画图坐标轴设置
使用matplotlib的示例:调整字体-设置刻度、坐标、colormap和colorbar等[python] view plain copy # -*- coding: utf-8 -*- #********************************************************** import os
2017-05-10 18:02:22 3037
转载 matplotlib画图plot线型设置
本文是学习《matplotlib for python developers》的一点笔记plot画图时可以设定线条参数。包括:颜色、线型、标记风格。1)控制颜色颜色之间的对应关系为b---blue c---cyan g---green k----blackm---magenta r---red w---white y----yellow有三种表示颜色的方
2017-05-10 15:10:34 22371 1
转载 机器学习 - xgboost参数详解
原文见:http://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/这篇文章按照原文的分节,共分为三个部分,其中本章介绍第一部分。 1、简介与XGboost2、参数理解3、参数调优关于XG
2017-05-08 17:11:27 1723
转载 Python格式化字符串format
自python2.6开始,新增了一种格式化字符串的函数str.format(),可谓威力十足。那么,他跟之前的%型格式化字符串相比,有什么优越的存在呢?让我们来揭开它羞答答的面纱。语法它通过{}和:来代替%。“映射”示例通过位置In [1]: '{0},{1}'.format('kzc',18) Out[1]: 'kzc,18' In [2]: '{},{}'.
2017-05-08 00:14:28 409
转载 机器学习 - 数据不平衡问题
这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是最重要的问题之一。一、数据不平衡在学术研究与教学中,很多算法都有一个基本假设,那就是数据分布是均匀的。当我们把这些算法直接应用于实际数据时,大多数情况下都无法取得理想的结果。因为实际数据往往分布得很不
2017-05-07 22:17:43 1126
转载 Python 内置函数 locals() 和globals()
1. 这两个函数主要提供,基于字典的访问局部变量和全局变量的方式。python 使用叫做名字空间的东西来记录变量的轨迹。名字空间是一个字典 ,它的键就是字符串形式的变量名字,它的值就是变量的实际值。名字空间可以像 Python 的 dictionary 一样进行访问。在一个 Python 程序中的任何一个地方,都存在几个可用的名字空间。每个函数都有着自已的名字空间,叫做局部名字空间
2017-05-07 00:05:58 896
转载 pandas修改DataFrame列名
Pandas中DataFrame修改列名在做数据挖掘的时候,想改一个DataFrame的column名称,所以就查了一下,总结如下: 数据如下:>>>import pandas as pd>>>a = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})>>> a A B C0 1 4 71 2 5
2017-05-05 23:08:24 77391 1
转载 C++ vector使用
在c++中,vector是一个十分有用的容器,下面对这个容器做一下总结。1 基本操作(1)头文件#include.(2)创建vector对象,vector vec;(3)尾部插入数字:vec.push_back(a);(4)使用下标访问元素,cout(5)使用迭代器访问元素.vectorint>::iterator it;for(it=ve
2017-05-03 01:59:06 555
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人