自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Data spark in Pypot

闪耀在Pypot中的数据火花……

  • 博客(49)
  • 资源 (1)
  • 收藏
  • 关注

翻译 【Python】Linux下python科学计算库的安装

scipy系列库有相当多的依赖,导致安装过程比较痛苦。要不停的去找依赖。发现一个小日本给出的安装过程:原载: http://memo.yomukaku.net/entries/jbRkQkq1.  安装Python 2.7.3 Python 2.7.3のインストール      cd srcwget http://www.python.org/ftp/pytho

2014-09-24 10:54:48 1930

原创 通过替换linux rm命令防止误删除

1. 在/home/username/ 目录下新建一个目录,命名为:.trash2.. 在/home/username/tools/目录下,新建一个shell文件,命名为: remove.shPARA_CNT=$#TRASH_DIR="/home/username/.trash"for i in $*; do STAMP=`date +%s` fileNam

2013-10-25 09:09:52 5146 1

转载 crontab用法

一.  Crontab 介绍        crontab命令的功能是在一定的时间间隔调度一些命令的执行。 1.1 /etc/crontab 文件       在/etc目录下有一个crontab文件,这里存放有系统运行的一些调度程序。每个用户可以建立自己的调度crontab。      如:[root@dave ~]# cat /etc/crontabSHEL

2013-10-08 15:06:00 1641

原创 【C/C++】面试题:函数指针

前几天,一哥们在简历中声称自己“精通”C/C++。我用了两个小问题让他知难而退了:问题1:定义了一个类,类中有一个函数,想把这个函数赋值给一个函数指针应该注意什么?他的回答是:函数指针应该加类域。正确接下来再问,如果要赋值给一个没有类域的指针,应该怎么办?他说:不能那样赋值,编译器会报错。继续问:没有办法骗过编译器进行赋值吗?他没回答上来。虽然他最终没答上来

2013-08-20 11:28:31 1970

转载 python 输出格式控制符的含义

d Signed integer decimal.   i Signed integer decimal.   o Unsigned octal. (1)  u Unsigned decimal.   x Unsigned hexidecimal (lowercase). (2)  X Unsigned hexidecimal (uppercase). (2

2013-08-19 09:36:37 2612

原创 python赋值机制

python的赋值(拷贝)分为两种,浅拷贝和深拷贝。 浅拷贝可以理解为传引用, 不开辟新的内存空间,只是取个别名而已;深拷贝可以理解为传值,需要新的内存空间。在python中,用 "="赋值和函数传参,都是浅拷贝。如:>>> class A:...     pass...>>> a = A()>>> a.k = 1>>> b = a>>> b.k1>>>

2013-08-14 19:45:31 1261

原创 【机器学习实践(2)】K近邻(KNN)模型

根据machine learing in action 第二章改编machine learing in action 是一本介绍机器学习实例的书,书中大量使用了scipy系列库,像matlab一样使用python。对我们学习python科学计算和理解机器学习都有很大的帮助。本文根据其第二章内容改编,原作代码有一些问题,这里的代码都是作者重新写的。转载请注明出处: 本文来自数据火花 ht

2013-08-14 08:05:17 2699

原创 Numpy的数组拼接

将array强制转换成list,用list的加法拼接>>> aarray([[ 1.,  1.,  1.],       [ 1.,  1.,  1.]])>>> barray([[ 0.,  0.,  0.],       [ 0.,  0.,  0.]])>>> c = array(list(a) + list(b))>>> carray([[ 1.

2013-08-14 07:09:59 5745

转载 Numpy数组

转自:http://blog.csdn.net/sunny2038NumPy数组是一个多维数组对象,称为ndarray。其由两部分组成:实际的数据描述这些数据的元数据大部分操作仅针对于元数据,而不改变底层实际的数据。关于NumPy数组有几点必需了解的:NumPy数组的下标从0开始。同一个NumPy数组中所有元素的类型必须是相同的。NumPy数组属性

2013-08-14 06:10:16 4552

原创 【机器学习实践(1)】配置python编程环境

作为一种看似简洁却内涵丰富的语言,python本身在机器学习方面并没有什么优势。但scipy(http://www.scipy.org/)等强大的第三方库,让python在机器学习方面得心应手。在【机器学习实践】系列文章中,我们都使用windows系统、eclipse编辑器(PyDEV插件)、winpython集成环境。

2013-08-14 00:42:49 2492

转载 python调试常用函数

type()、str()、repr()type:得到对象类型str:生成一个对象的可读性好的字符串表示,它的返回结果通常无法用于eval()求值, 但很适合用于 print 语句输出。repr和``:返回对象的“官方”字符串表示,绝大多数情况下可以通过求值运算(使用eval()内建函数)重新得到该对象。repr和``输出对 Python 比较友好,而str()的输出对人比较友好。

2013-08-13 23:38:27 1061

原创 【Python】python "TypeError: 'NoneType' object is not iterable"错误分析

定义了如下的函数def process(): value = calc_val() if condition(value): return True, value;

2013-08-13 19:31:48 127718 4

原创 注意python dict的内容变化

下面的代码,执行有错:class TripleDataFilter(): def __init__(self): self.idFilter = None self.propFilter = None self.valueFilter = None self.prefilter = None self.fi

2013-08-12 14:53:04 1577

转载 python不定参数

转自http://bbs.chinaunix.net/thread-1808085-1-1.html函数声明的时候参数前面加*说明接受不限数量的无名参数…………在函数体内这个参数实际上是一个列表……包含固定参数外的所有无名参数……不定的有名参数可以用**来声明……在函数体内是一个字典……详细的说明还是看专门的教材吧。。。。def test(parm1,parm2,*ar

2013-08-12 14:40:46 1211

原创 自定义linux命令提示符格式

修改环境变量PS1(命令行提示符)即可,如:export PS1='[\u@\h \W]\$ '其中\u显示当前用户账号,\h显示当前主机名,\W显示当前路径,\$显示'$'符号可以使用vi编辑/etc/profile文件,在最后加上: export PS1='[\u@\h \W]\$ ' 以后每次登入,命令提示符都会按自定义格式显示。

2013-08-06 14:35:57 1595

原创 【面试题】如何让C语言自动发现泄漏的内存

1. 题目改造malloc和free函数,使C语言能自动发现泄漏的内存,在程序退出时打印中遗漏的内存地址和大小。2. 思路用一个链表来记录已经分配的内存地址。在malloc时,把分配的内存地址和大小插入链表;在free时,找到链表中相应结点,删除该结点。程序退出时,打印出链表中的结点。上述思路有一个缺陷:删除结点时,需要遍历链表,如何才能变成常数时间能完成的操作?方

2013-08-02 17:02:13 1414 2

转载 linux svn命令大全

1、将文件checkout到本地目录 svn checkout path(path是服务器上的目录) 例如:svn checkout svn://192.168.1.1/pro/domain 简写:svn co 2、往版本库中添加新的文件 svn add file 例如:svn add test.php(添加test.php) svn add *.php(添加当

2013-08-02 16:02:56 883

原创 linux命令集:按从大到小的顺序显示当前目录下的各子目录和文件大 小

可以通过添加alias DU="du -s ./* | sort -rn | awk '{print \$2}' | xargs du -sh"这样一行alias到src文件中,再source这个文件即可。其中:使用到awk变量时,要注意:需要对$前加转义斜杠,否则会被当作shell变量。

2013-08-02 14:54:07 3460

原创 linux命令集:删除指定名称以外的文件

在一个目录下,想保留某几个文件,删除其它所有文件。应该怎么做呢?比如要保留目录下后缀为 .keep的文件,删除其它的:方法一:可以通过 grep -v 和 xargs 来实现。命令如下:1ls | grep -v ".*\.keep" | xargs rm其中:grep 的-v选

2013-08-02 14:47:31 2724

原创 vim复制代码时,不小心把行号也复制进来了,怎么修正

使用如下的替换::%s#^\s*\d\+##g即可消除所有开头的数字。

2013-08-01 17:37:03 4718

原创 C++中,类的sizeof运算结果

#include using namespace std;#define SHOW_SIZE(t) cout << #t << " size: " << sizeof(t) << endl;class VoidClass{};class VirtualBase{public: virtual ~VirtualBase() {}};class DerivedA :

2013-07-31 07:28:06 1299

原创 C语言强制类型转换

当C/C++进行强制类型转换时,会有两种方式:1. 保持内存中的内容不变,仅修改对这段内存的解释方式, 如int和char的互转2. 保持值不变(近似),但修改内存中的内容,如int和double的互转本文讨论了这两类转换的应用场景。

2013-07-24 12:03:09 3921

原创 Cracking the coding interview--Q1.1(python的位操作)

在微博上看到有人用C++实现了一遍《Cracking the coding interview》上的题目。自己目前正在学习python,也凑凑热闹。

2013-07-09 10:57:00 1768

原创 [shell小工具] 显示文件指定行的内容

if [ $# -lt 2 ] ; then    echo "USAGE: $0 {file_name} {start_line} [{end_line}]"    exit -1 fiif [ $# -eq 2 ] ; then    cat $1 | head -n $2 | tail -n 1fiif [ $# -gt 2 ] ; then

2013-04-28 14:29:03 1082

原创 如何避免Hadoop streaming 自动给单行数据加tab

使用hadoop streaming时,如果数据只有一列,hadoop会自动在结尾加\t。避免这种情况有两种解决方法:1. 使用重定向:这也有两种实现1)一种通过hadoop dfs -put/copyFromLocal命令,把streaming的标准输出重新定向到输出路径。如:${HADOOP_HOME}/bin/hadoop --config

2013-04-26 10:22:22 3606

原创 SecureCRT rz 工具上传某些格式的文件出错的解决办法

SecureCRT在使用 rz 工具上传某些格式的文件会出错。解决办法是:使用 -be选项即 rz -be

2013-04-22 15:02:25 1397

原创 希腊字母的正确读音

数据挖掘那一摩尔公式中,常常会用到一摩尔希腊字母,这些希腊字母的读法你全部知道么?不知道的话,就来看看下图吧:注:上图英文注音是正确的,但中文读音有一些错误。如Chi,中文注音应该是“凯”这里有希腊字母的读音:http://app.baidu.com/greekalphabeta?keyword=%E5%B8%8C%E8%85%8A%E5%AD%97%E6%AF%8D%E5

2013-02-18 20:39:46 2812

转载 免费数据分析辅助工具整理

数据清理类工具     DataWrangler     Google Refine统计分析类工具      The R Project for Statistical Computing     TimeFlow数据展现类工具     Google Fusion Tables    Impure     Tableau Public

2013-02-18 08:30:35 960

转载 hadoop streaming常用配置项

Job confmapred.job.nameThe name of the job.mapred.mapper.classorg.apache.hadoop.mapred.lib.IdentityMapperThe full class name of the mapper.mapred.combiner.classThe

2013-01-18 10:42:20 1010

转载 信息检索和网络数据挖掘领域论文技术基础

信息检索和网络数据领域(WWW, SIGIR, CIKM, WSDM, ACL,EMNLP等)的论文中常用的模型和技术总结引子:对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。我

2013-01-08 14:21:47 756

原创 【C/C++】在一个类中重载另一个类的构造函数 ----构造函数是一个特殊的操作符

假设我们有两个类A,Bclass A{public:    A(int n) : a(n){}      void Print() {cout << a << endl;}private:        int a;  };class B{public:    void SetVal(int a) {b = a;}private:

2012-12-13 13:15:33 1515

原创 【C/C++】boost regex正则表达式的安装及使用

一、安装1. 下载在 官网http://www.boost.org/ 上可以找到最新的boost库2. 安装1)使用管理员权限,运行:sudo ./bootstrap.sh生成bjam文件2)sudo ./bjam3)update动态链接库: sudo /sbin/ldconfig即完成安装二、使用1. 需要的头文件#include

2012-12-10 21:44:50 1082

原创 【Shell】shell中执行字符串定义的命令

cmd="echo \"hello\ > out.rslt"$cmd 这样运行是得不到正确结果的。结果是:不重新到指定的out.rslt文件,而是在标准输出上显示"hello" > 1.err需要改为cmd="echo \"hello\ > out.rslt"echo $cmd | sh

2012-12-10 16:40:35 1906

原创 【Shell】shell中执行一个字符串定义的语句

cmd="echo \"hello\ > out.rslt"$cmd 这样运行是得不到正确结果的。结果是:不输出到指定的out.rslt文件,而是在标准输出上显示"hello" > out.rslt需要改为cmd="echo \"hello\ > out.rslt"echo $cmd | sh

2012-12-10 16:39:07 1331

原创 VIM锁屏与解锁

VIM经常不小心被自己锁住,查了解锁方法后,不久又会忘记。现在记录一下,提醒一下自己:在vim中:使用 CTRL+s 可以锁屏使用 CTRL+q 可以解锁。PS:ctrl+z停止进程后, 用fg恢复。

2012-12-05 10:48:31 8408

转载 awk常用字符串处理函数

gsub(regexp, replacement [, target])Search target for all of the longest, leftmost, nonoverlapping matching substrings it can find and replace them with replacement. The ‘g’ in gsub() stands for “gl

2012-11-29 15:17:42 2178 1

原创 hash_map 自实现hash函数容器错误

使用hash_map时,自实现了一个hash函数容器struct StringHasher {

2012-11-27 20:12:03 741

原创 outlook附件保存位置

打开outlook附件,做了修改后。却不知道改后的文件在哪?默认情况,在这里:C:\Documents and Settings\{你的用户名}\Local Settings\Temporary Internet Files\Content.Outlook\打开这个,仔细找找吧,祝你好运。

2012-11-26 15:54:06 2779

原创 【C/C++】类成员函数地址的获取及使用方法

#include using namespace std;class A{public:A() : a(910){};void foo1(int i) { cout << "hello, foo1" << endl;}void foo2(int i) { cout << "hello, foo2\t" << a << endl;}private:int a;};

2012-11-05 09:22:09 1553

转载 【Shell】shell中的if语句判断参数

-b 当file存在并且是块文件时返回真   -c 当file存在并且是字符文件时返回真    -d 当pathname存在并且是一个目录时返回真    -e 当pathname指定的文件或目录存在时返回真    -f 当file存在并且是正规文件时返回真    -g 当由pathname指定的文件或目录存在并且设置了SGID位时返回为真    -h

2012-11-05 09:03:11 1623

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除