2015年12月_autoliuweijie

原创 [笔记]chmod 修改文件权限

1. 查看文件权限指令：ls -l-rw-r--r-- 1 apple users 2254 2006-05-20 13:47 tt.html从第二个字符起rw-是说用户apple有读、写权，没有运行权，接着的r–表示用户组users只有读权限，没有运行权，最后的r–指其他人（others）只有读权限，没有写权和运行权。2. 修改文件权限指令：chmod 777 filenamechmod 7

2015-12-30 15:50:29 531

转载如何使用pdb调试python程序

原文：http://blog.csdn.net/luckeryin/article/details/4477233本文讨论在没有方便的IDE工具可用的情况下，使用pdb调试python程序。1. 源码例子例如，有模拟税收计算的程序：#!/usr/bin/python def debug_demo(val): if val <= 1600 :

2015-12-19 11:55:37 625

原创 [笔记]修改mac终端命令行前缀的显示

/etc/bashrc 中的PS1变量就是用来设置前缀显示的。$sudo vim /etc/bashrc修改PS1变量，例如修改为如下形式：(把原来的注释掉）# PS1='\h:\W \u\$ 'PS1='\u\$ 'wq!保存并退出，将终端退出重新打开生效。附： \h表示本地主机名 \W表示符号~ \u表示用户名 $表示符号$ 如果你喜欢也可以按照以上规律自己定制PS1参数

2015-12-17 19:41:24 18636

原创 [笔记]c++包含纯虚函数的类不允许被实例化

class CalcTax{public: virtual void calc_tax()=0; // 纯虚函数};class SalesOrder{private: CalcTax* calc_tax_way ＝ new CalcTax(); // CalcTax不能被实例化 public: SalesOrder(CalcTax* calc_tax_in){

2015-12-16 22:12:27 11303

原创 g++/make: C++程序文件组织模版

本文为C++程序在不使用IDE情况下，自己组织文件结构的模版；用g＋＋完成编译和连接过程，make来帮助完成一些自动化过程。一. 文件结构文件结构：文件内容:main.cpp:#include "testA.h"#include "testB.h"#include "./c_dir/testC.h"#include <iostream>int main(void){ cla

2015-12-16 17:22:37 439

0. 写在前面本项目为研一时《设计模式》课程的总结与扩展，课程教授为北京大学软件工程中心王亚沙教授，参考书为王老师的课件以及四人帮的《设计模式－可复用面向对象软件的基础》。我将在本工程中用C++语言和python语言实现一些常用的设计模式，用于巩固理解和后续查询。另外值得一题的是，许多设计模式是基于java或c++给出的，用来弥补编译器层面上的语言不足。而python这类的高级语言有的时候以及将这些

2015-12-16 12:31:36 533

转载 [转]《设计模式》python实现

原文： http://www.cnblogs.com/wuyuegb2312/archive/2013/04/09/3008320.html一、简单工厂模式模式特点：工厂根据条件产生不同功能的类。程序实例：四则运算计算器，根据用户的输入产生相应的运算类，用这个运算类处理具体的运算。代码特点：C/C++中的switch…case…分支使用字典的方式代替。　　　　　使用异常机制对除数为0的情况进行处理

2015-12-16 11:33:29 645

原创 Django配置static files

第一部分：在开发环境下1.说明本篇旨在阐明如何在开发环境下为django项目配置static files，所谓开发环境是指以manage.py run server指定的服务器发布，且settings.DEBUG = True，此时将由django程序处理静态文件。2.django处理静态文件流程django提供了django.contrib.staticfiles app模块来帮助我们发布静态文件

2015-12-14 10:33:34 2647

原创 jquery与django实现ajax通信

写在前面：在web上通常通过http协议中的get/post文件发送数据或者请求。在浏览器中输入url后，浏览器就帮助我们完成get请求的发送与返回文件的解析，并刷新更新界面。但是如果我们不想更新界面，只想发送一个get或者post文件把数据（请求）传给服务器端，然后获取服务器返回的response文件。这个时候就可以利用ajax技术实现。实现ajax有两种方法，一种是用原生的javascript发

2015-12-14 10:28:05 19385 3

原创如何正确开始一个python项目（django为例）

写在前面：如果随意创建一个python项目，那么该项目往往会很依赖本地的环境，当项目移植到其他机器上，往往会出现兼容性问题（python版本不一致，缺少包等）。本文以django项目为例介绍如何开始一个python项目，包括创建干净的python虚拟环境，安装需要的包，创建工程，git托管4个步骤。0. 准备工作：本机先需要安装好python2.*，git，virtualenv工具。关于如何安装，方

2015-12-13 21:29:20 5500

原创 HTTP文件协议介绍

HTTP文件协议介绍写在前面：本文只是http文件协议的介绍，不是http协议介绍，故不包括dns解析等其他内容，旨在从应用层面介绍http文件。1.HTTP简介1.1 HTTP协议的简介与作用&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsphttp协议是建立在tcp协议80(默认)端口上的一个通讯协议，有了这个通讯协议，在两台机器中就可以通过URL接收与发送内容。

2015-12-13 21:25:03 1674

原创 nginx + gunicorn + virtualenv部署django

环境：ubuntu 14.04 64bit + django 1.8.0 + nginx 1.80 + virtualenv + gunicorn1.准备工作安装nginx 这里安装的nginx1.80。安装教程：http://www.jikexueyuan.com/course/1470_2.html?ss=1创建virtualenv# mkdir ~/mysite.com/www.da

2015-12-13 21:09:04 1681

原创 python CSV模块使用笔记

import csvcsv.reader:reader(csvfile[, dialect=’excel’][, fmtparam])reader = csv.reader(file('glucoseData.csv', 'rb'))for line in reader: print line>>['l490', 'l660', 'l730', 'l850', 'l930', 'gluc

2015-12-13 21:00:45 1608

转载 [转]傅立叶变换与小波分析的关系

转到原文

2015-12-13 20:53:00 522

转载 [转]干货：结合Scikit-learn介绍几种常用的特征选择方法

> 文章 > 技术专区 > 干货：结合Scikit-learn介绍几种常用的特征选择方法干货：结合Scikit-learn介绍几种常用的特征选择方法技术专区小林子 8个月前 (04-08)

2015-12-13 20:41:01 1947

原创机器学习：FP-growth 发现频繁项集

参考: [1] 《机器学习实战》 Peter1. 理论概述：用项集的集合构造出FP树，再从FP树中挖掘出频繁项集。该方法会比Apriori更高效步骤:第一步: 创建FP树第二步: 从FP树中挖掘出频繁项集示例:参考Peter写出的实例，具体代码见附录，调用过程如下:# 获取数据data_set = [ ['r', 'z', 'h', 'j', 'p'], ['z', 'y

2015-12-13 20:31:07 1065

原创机器学习：Apriori发现频繁项集和关联规则

参考: [1] 《机器学习实战》 Peter1. 理论概述：Apriori算法可以用来发现频繁项集，进而在频繁项集的基础上发现关联规则。一些概念：频繁项集（frequent item sets): 物品的集合称为项集，经常出现的项集称为频繁项集，例如{啤酒，尿布，豆奶}；支持度(support)：是针对一个项集来定义的，数据集中包含该项集的记录所占的比例，用来衡量一个项集的频繁程度；关联规则(a

2015-12-13 20:28:35 3401

原创机器学习：隐马尔可夫模型(HMM)

参考：[1]《统计学习方法》李航 2012年3月第一版1. 理论概述：隐马尔可夫模型是一个关于时间序列的概率模型，模型由初始状态随机生成不可观测的状态序列（隐藏的马尔可夫链），再由状态序列中的状态随机生成可观测的观测序列。模型：在定义马尔可夫模型前，先定义这个模型相关的一些量。所有可能的N个状态的集合Q:所有可能的M个观测的集合V:长度为T的状态序列I，其中i_{?}为序号，对应状态集合Q中的

2015-12-13 20:25:03 5294

原创机器学习：特征缩减技术(shrinkage): lasso和岭回归

1. 理论概述:通过对损失函数(即优化目标)加入惩罚项，使得训练求解参数过程中会考虑到系数的大小，通过设置缩减系数(惩罚系数)，会使得影响较小的特征的系数衰减到0，只保留重要的特征。常用的缩减系数方法有lasso(L1正则化)，岭回归(L2正则化)。缩减系数的目的2.1 消除噪声特征:如果模型考虑了一些不必要的特征，那么这些特征就算是噪声。噪声是没必要的，使得模型复杂，降低模型准确性，需要剔除。

2015-12-13 20:19:37 20722 1

原创机器学习：集成算法(Ensemble Method)

1. 集成算法：  将多个分类器集成起来而形成的新的分类算法。这类算法又称元算法(meta-algorithm)。最常见的集成思想有两种bagging和boosting。2. 集成思想：boosting：基于错误提升分类器性能，通过集中关注被已有分类器分类错误的样本，构建新分类器并集成。bagging：基于数据随机重抽样的分类器构建方法。  3. 算法示例：随机森林（Random For

2015-12-13 20:13:32 15581

原创机器学习：支持向量机(SVM)

1. 理论概述：利用训练集在特征空间中求出一个分类超平面(w,b)把样本切割开，依靠该超平面对新样本进行分类。如果训练集在当前的特征空间中无法分割，则用核技术的映射函数把原特征空间映射到高纬或者无穷维空间再切割。基本概念：超平面：用(w,b)表示， w1*x1 + w2*x2 +...+ wn*xn = 0 表示在特征空间中的一个平面。需要注意的是，一个平面可以对应多个(w,b)。函数距离（间

2015-12-13 20:08:26 2792

原创机器学习：逻辑回归(Logistic Regression)

1. 原理概述：这是一个分类模型。当输入一个新样本的时候，把样本的特征值输入到f(X)函数中，再将f(X)的结果输入到sigmoid函数中，输出即为分类结果。训练过程就是通过训练集合寻找f(X)的系数，使得分类误差最小。f(X)常用线性函数，训练的算法有梯度法、牛顿法等。sigmoid函数：logisitic分布的分布函数就是sigmoid函数。logistic模型：其中：f(X)可以是任意函

2015-12-13 19:57:22 972

原创机器学习：朴素贝叶斯(Naive Bayes)

1. 理论概述：贝叶斯算法中认为某个类在特征空间中出现某种特征的组合的概率为p。如果新输入一个实例，计算各个类出现这个新样本的特征的概率，选取概率最大的一个类作为新样本的分类（当然也可以根据贝叶斯公式给出各个分类的概率，即可能性）。p通过统计训练集中的样本来获得，其中会假设各个特征之间相互独立（这也是被称作naive的原因）。关键原理：当分类Y=ck时，出现特征组合X＝x的概率为: 上公等号左边

2015-12-13 19:54:54 2070

原创机器学习：决策树（Decision Tree）

决策树（Decision Tree）作者：刘伟杰日期：2015-11-27 参考： [1]《统计学习方法》李航 2012年3月第一版 [2]《机器学习实战》 Peter Harrington 1. 理论概述：决策树的内部节点表示一个特征或属性，叶子节点表示一个类别。输入一个新样本，从根节点开始按照节点说示的特征划分，直到划分到叶子节点，该叶子节点即为类别。关于熵的基础

2015-12-13 19:34:27 3667

原创机器学习： k－近邻（kNN)

机器学习： k－近邻（kNN)作者：刘伟杰日期：2015-11-27 参考： [1]《统计学习方法》李航 2012年3月第一版 [2]《机器学习实战》 Peter Harrington 1. k-nn描述:给定一个训练数据集，对于新输入的实例，在训练集中找到与该实例最近的k个实例，统计这k个实例中多数的类别，就把该类别作为新输入实例的类别。2. 参数:距离度量：Lp距离（

2015-12-13 19:23:43 686

Avalon