自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

vivianwang

紀錄保留

  • 博客(24)
  • 收藏
  • 关注

转载 <linux> 學習map

http://mt.sohu.com/20160517/n449979876.shtml  最近看到了一篇新闻,linux之父建议找一份基于linux和开源环境的工作,确实,这已经是未来的大趋势了。今天就来聊一聊我的想法,本人8年linux运维一线经验,呆过很多互联网公司,从一线运维做到运维架构师一职,也见证了中国运维行业从无人问津到可圈可点的整个演变过程。Linux系统目前主

2016-08-08 22:12:46 276

原创 <mysql> 特殊技巧

添加新列序列號http://www.jb51.net/article/87351.htm第一种方法:select   (@i:=@i+1)   as   i,table_name.*   from   table_name,(select   @i:=0)   as   it 第二种方法: set @rownum=0;sele

2016-08-08 17:09:32 316

原创 <spark> 集群下運行範例紀錄

# 查看任一日志總條數import findsparkfindspark.init()from pyspark import SparkContext,SparkConfconf=SparkConf()conf.setMaster("spark://172.XX.XX.XX:7077")conf.setAppName("test-count")sc = SparkContext(

2016-08-05 15:20:24 278

转载 <SPARK-轉載> spark 集群运行python作业

http://blog.csdn.net/xiaolewennofollow/article/details/47171951今天尝试用刚搭建好的spark集群运行python作业,遇到了一些问题,解决了一些坑的同时也对spark集群的运作和配置方式有了一些比较浅的认识,不像之前那么没有概念了,记录如下,之后还要继续更多的对Hadoop生态圈和spark并行计算框架的探究。首先说下

2016-08-04 18:15:26 1591

转载 <python> 拿取命令列的參數值

本篇将介绍python中sys, getopt模块处理命令行参数如果想对python脚本传参数,python中对应的argc, argv(c语言的命令行参数)是什么呢?需要模块:sys参数个数:len(sys.argv)脚本名:    sys.argv[0]参数1:     sys.argv[1]参数2:     sys.argv[2]test.py

2016-08-04 17:15:27 326

转载 <python> ftp 使用指南

http://blog.csdn.net/linda1000/article/details/8255771[python] view plain copy print?# 例:FTP编程  from ftplib import FTP        ftp = FTP()  timeout = 30  port =

2016-08-04 10:22:41 1434

转载 <DATA-轉載>【数据科学】教你成为数据科学“大咖”!

随着互联网的迅猛发展,在线学习逐渐成为主流,MOOC、慕课等概念如雨后春笋般涌现。以往高等学府才能接触到的计算机科学和数据科学,也随着这次风潮来到了公众面前。OSDSM,即数据科学开源课程,能够从理论和技术两方面,帮助人们学习有效利用数据的核心技能。一、利用互联网成为“大咖”随着互联网的迅猛发展,网络公开课的网站和APP等日益成熟,从听课、讨论到考试,一条龙的自学服务已经颇成规模。这些课程中,

2016-08-02 15:20:57 489

转载 <DATA-轉載>如何成为一名数据科学家?

如何成为一名数据科学家?http://daily.zhihu.com/story/3909126?from=timeline&isappinstalled=0 谢科,数据科学,机器学习,康奈尔大学PhD研究生"Data Science = statistics who uses python and lives in San Francisco"恰好

2016-08-02 15:19:14 287

原创 <hdfs>基本操作

基本操作(創件上傳刪除下載)http://zh.hortonworks.com/hadoop-tutorial/using-commandline-manage-files-hdfs/

2016-08-01 10:11:13 272

原创 <spider> 文章保存

1. Python 并发网络库 eventlet 性能测试http://www.jianshu.com/p/1798052d086e

2016-07-30 22:31:10 259

转载 <hadoop>hdfs 介紹

简介HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Google 文件系统(中文,英文)。HDFS有很多特点:    ① 保存多个副本,且提供容错机制,副本丢失或宕机自动恢复。默认存3份。    ② 运行在廉价的机器上。

2016-07-29 22:28:22 208

原创 <speaking>語言提升

昨天你們問到那個素材的說都知道了,怎麼回復比較好,今天看到有兩句話覺得非常好的回答:1、進行簡單的品鑒跟分析貌似已知的經驗跟內容,有助於確保自身經驗是否在變化的市場中繼續維持正確的方向2、在分析跟總結內容上確保是否忽略新出現的關鍵點及趨勢,以及時做好應對

2016-07-29 18:34:22 189

原创 <source> 各路資源

1. gitbookhttps://www.gitbook.com/book/carolhsu/django-girls-tutorial-traditional-chiness/details

2016-07-26 23:10:55 207

原创 <data> 數據模型範例

1. 用户在线广告点击行为预测的深度学习模型http://geek.csdn.net/news/detail/91293

2016-07-26 22:55:53 376

原创 <mac>環境架設

1. python多版本設定   http://blog.csdn.net/lijiang1991/article/details/51830978

2016-07-26 22:34:44 207

原创 <spark>集群環境創建

入門配制指南 這是單機的http://blog.jobbole.com/86232/這是集群的http://www.cnblogs.com/onetwo/p/5424377.html 安裝java jdkhttp://jingyan.baidu.com/album/c74d60007b85510f6a595dfa.

2016-07-19 09:27:42 257

原创 <centos>linux 指令

系統操作指令  重開機reboot列出之前打過的指令(存在個人目錄下的 .bash_history裡面)history查看自己來源位置who安裝軟體yum install nmap使用預設參數掃瞄本機所啟用的 port(在預設的情況下, nmap 僅會掃瞄 TCP 的協定喔! )#nmap localhost

2016-07-18 18:19:02 266

原创 <spark> 單機模式之環境創建

1.  入門指南http://blog.jobbole.com/86232/2.  ipython 使用spark 環境設置http://ramhiser.com/2015/02/01/configuring-ipython-notebook-support-for-pyspark/(錯誤處理)沒有讀到設置檔http://stackoverflow.

2016-07-15 14:04:49 254

原创 <python> 匯入excel

导出 excel 时遇到的非法字符问题http://cooperluan.github.io/python/2015/01/08/pandas-daochu-excel-zhong-de-luan-ma-wen-ti/

2016-07-08 17:24:09 395

原创 <python> 多線程/多進程/異步學習

1. Python-aiohttp百万并发 (上)http://python.freelycode.com/contribution/detail/2012. Python-aiohttp百万并发 (下)http://python.freelycode.com/contribution/detail/2033. 理解python中的多线程http:/

2016-07-08 11:54:09 282

原创 <python> 簡單web框架實現

用Python写一个简单的Web框架http://www.cnblogs.com/russellluo/p/3338616.html

2016-07-01 16:16:02 232

原创 <Python> 自定義類+引用方法

兩步步驟:PARTA 添加文件至site-packages目錄下PARTB  添加位置說明檔

2016-06-23 13:34:27 227

原创 網絡爬蟲,防止被ban

@匿名爬蟲 tor pysockethttp://www.evil0x.com/posts/14147.html@防止被ban:表頭、cookies、切換iphttp://www.tuicool.com/articles/JVryQvb@useragent 池http://m.blog.csdn.net/article/details?id=357743

2016-06-08 10:20:09 313

原创 分部式爬蟲(一) 創建環境

本篇說明如何建置爬蟲的分部式環境,使用Centos 6.5,重頭開始部屬1. 首先先下載GIT說明:之後做版本控制和下載開源項目需要使用到@下載 develope toolshttp://www.linuxidc.com/Linux/2015-02/113351.htm@yum下載githttp://www.centoscn.com/image-

2016-06-03 13:24:06 268

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除