自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Sniper24's Tech Archive

数据分析新兵一名。粗通Python

  • 博客(20)
  • 收藏
  • 关注

原创 杂技0809

Python 技术 http://www.cnblogs.com/kaituorensheng/p/4465768.html python进程池的使用Hadoop/Hive/Spark 技术机器学习算法其他WordPress WordPress建站 http://blog.csdn.net/kobeguang/article/details/19960277 WordPress插件

2016-08-09 11:10:42 443

原创 CDH安装Hadoop 手记——之支线任务

CDH安装Hadoop 手记——之支线任务设置root用户(如果用VMWare虚拟机)设置NAT网络模式 设置主机和虚拟机在同一个网段?配置ssh修改hosts vi /etc/hostname修改主机名注意一个小问题: ubuntu下的vim有些问题,可以通过下面语句回复 sudo apt-get install vim修改apt-get默认源使用下面命令备份 /etc/apt

2016-08-09 11:09:40 461

原创 CDH 方式安装 Hadoop 手记

TEST

2016-08-09 11:08:39 244

转载 openpyxl 读写Excel Workbook

http://blog.csdn.net/hxsyewlink/article/details/6265790注意,截止2016-02-01 openpyxl仍不支持读取表格和图像,所以如果打开又以同样的名称保存,表格和图像将会丢失。(不过似乎支持插入图像)workbook in memoryfrom openpyxl import Workbook w

2016-05-20 14:49:56 980

转载 [Python学习]Python中的with语法

浅谈 Python 的 with 语句with 语句是在 Python 2.5 版本引入的,从 2.6 版本开始成为缺省的功能。with 语句作为 try/finally 编码范式的一种替代,用于对资源访问进行控制的场合。本章对 with 语句进行介绍,包括 with 语句的基本语法和工作原理,自定义支持 with 语句的类,以及使用 contextlib 工具加入对 with

2016-02-22 11:17:13 395

原创 Python 进程与线程

目录:模块:multiprocessing多进程,threading多线程1. Python多进程ProcessPool进程池multiprocessing.Lock2. Python 多线程ThreadThreadPool线程池threading.Lock3. 锁机制4. 进程之间的通信:multiprocessing.Queue 队列mult

2016-02-22 10:48:33 386

转载 廖雪峰教程笔记补遗

1. 关于中文字符串(最后一次)#coding: utf-8 显示,写入文件均正常2. 高阶函数sorted()  (升序)sorted()可以传入一个函数通常规定,对于两个元素x和y,如果认为x ,则返回-1,如果认为x == y,则返回0,如果认为x > y,则返回1,这样,排序算法就不用关心具体的比较过程,而是根据比较结果直接排序。

2016-02-17 18:02:41 450

转载 Python装饰器学习(九步入门)

转载自http://www.cnblogs.com/rhcad/archive/2011/12/21/2295507.html这是在Python学习小组上介绍的内容,现学现卖、多练习是好的学习方式。第一步:最简单的函数,准备附加额外功能12345678#

2016-02-05 11:31:22 413

原创 openpyxl笔记 重制版

参考资料:# 官方文档http://packages.python.org/openpyxl/api.html# openpyxl 读写excel2007使用笔记http://blog.csdn.net/hxsyewlink/article/details/6265790注意,截止2016-02-01 openpyxl仍不支持读取表格和图像,所以如果打开又以同样的名称保存

2016-02-04 09:47:22 1823

原创 Scrapy爬虫框架笔记

1.  启动Scrapy爬虫除了常用的 scrapy crawl 来启动Scrapy,您也可以使用 API 在脚本中启动Scrapy。2. XPath 定位 Firebug(Firefox插件)可以使用Chrome的XPath helperfirefox上的若干插件3. 关于登陆爬取http://outofmemory.cn/code-snippet/1

2016-02-04 09:46:42 345

转载 text mining资料

http://rzcoding.blog.163.com/https://www.zhihu.com/question/20631050

2016-02-03 10:53:09 322

转载 一个可能有用的Python+MQL4混合编程网址

https://www.mql4.com/go?http://sites.google.com/site/prof7bit/metatrader-python-integration

2016-02-02 16:08:44 6626

原创 Scrapy爬虫笔记-未完成

启动Scrapy爬虫 除了常用的 scrapy crawl 来启动Scrapy,您也可以使用 API 在脚本中启动Scrapy。XPath 定位 Firebug(Firefox插件) 可以使用Chrome的XPath helper firefox上的若干插件关于登陆爬取 http://outofmemory.cn/code-snippet/16528/scrapy-again-to-

2016-02-01 11:01:50 580

原创 SAS

逻辑库导入逻辑库:导入本地文件夹?通过ODBC                         i.             直接指定位置     libname mydata 'c:\my documents\sasfiles';                       ii.             其他方式(包含从数据库导入) 导入数据集:直接

2016-01-15 18:03:06 1000

转载 Python 标准模块 ConfigParser(转)

发现python读写配置文件比较方便。import ConfigParser接口:ConfigParser.ConfigParser()读写文件:read write结构: config file =>sections=>options=>items读取某个option的值(str): get(section,option)1) 基本的读取配置文

2015-11-09 10:41:01 240

原创 Hive table 操作

http://www.cnblogs.com/ggjucheng/archive/2013/01/04/2844393.htmlCreate [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], …)] [COMMENT table_comment] [PARTITI

2015-11-02 14:58:14 131

原创 pyspark笔记

pyspark.sql.SQLContextTop funcs: 1. 创建DF createDataFrame(data,schema) 2. 从多种数据源读取数据,sqlContext 3. user-define类 registerDataFrameAsTable(df, tableName) registerFunction(name, f, returnType=StringT

2015-10-26 11:36:06 1130

原创 NumPy 笔记[0]

回到NumPy的话题,开始分析来自这个地址的数据集。df=np.genfromtxt(filename,skip_header=1,delimiter=",",converters=None,names=True)然后就出问题了,ValueError: Some errors were detected ! Line #146 (got 18 columns instead of 17)这可

2015-10-25 00:46:00 426

原创 python regex 入门笔记

可以参考这篇博文: http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.htmlimport re正则表达式,我的理解就是匹配文本中的pattern,那么这个过程可以分解为两个部分: A. 定义自己需要的pattern B. 用自己定义好的pattern在目标文本中进行匹配,然后对匹配到的对象进行操作确定一个pattern,最主要的两个

2015-10-24 21:48:15 331

转载 频率学派和贝叶斯学派的区别

http://www.zhihu.com/question/20587681另一个回答:很多人能讲出一大堆哲学理论来阐明这一对区别。但我觉得,从工程师角度来讲,这样理解就够了:频率 vs 贝叶斯 = P(X;w) vs P(X|w) 或 P(X,w) 你是把参数当作一个待确认系数 还是一个随机变量。==============================

2015-09-30 09:27:12 699

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除