自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

困而学之,学思并重

学而不思则罔,思而不学则殆。

  • 博客(10)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 Python操作MySQL

这篇文章主要记录如何使用Python操作MySQL数据库的基础知识点。准备工作在开始之前需要先安装MySQL数据库,以及应用模块MySQLdb。很简单:$ sudo apt-get install mysql-server$ sudo apt-get install python-mysqldb接下来,需要在MySQL中建立一个新的数据库testdb和新用户Do,以便操作。$ mysql -

2016-12-23 20:54:17 1047

原创 【Python那些事儿】Python中的生成器

生成器(generator)生成器,即生成一个容器。在Python中,一边循环,一边计算的机制,称为生成器。生成器可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他数据类型需要调用自己的内置iter()方法或__iter__()的内置函数),所以,生成器就是一个可迭代对象。在Python中,使用生成器可以很方便的支持迭代器协议。生成器优点python使用生成器对延迟操作提供了支

2016-12-21 20:08:33 3484

原创 【Python那些事儿】Python中的迭代器

主要记录:迭代器(iterator)协议对象必须提供一个next()方法,执行该方法时,要么返回迭代中的下一项,要么引起一个StopIteration异常。只能往前访问,不会后退。在Python中,支持迭代器协议就是实现对象的__iter__和next()方法。 __iter__方法:返回迭代器对象本身;next()方法:返回容器中的下一个元素,在结尾时引发StopIteration异常终

2016-12-21 17:25:28 3614

原创 MySQL into outfile 问题解决:ERROR 1 (HY000): Can't create/write to file

任务:从MySQL导数据导出数据到本地——select * into outfile '/home/spark/data.csv' fields terminated by ',' lines terminated by '\n' from mytable;错误信息:ERROR 1 (HY000): Can't create/write to file '/home/spark/data.csv'

2016-12-15 14:04:48 6813

原创 MySQL数据库操作

主要内容:MySQL安装基本MySQL命令行操作数据库知识数据库(database):即容器——保存有组织的数据;表(table):某种特定类型数据的结构化清单;模式(schema):关于数据库和表的布局及特性的信息;列(column):表中的一个字段,所有表都是由一个或者多个列组成的;数据类型(datatype):所容许的数据的类型。每个表列都有相应的数据类型,它限制该列中存储的数

2016-12-14 21:47:47 433

原创 Ubuntu16.04安装R及RStudio

主要内容:介绍在Ubuntu16.04上安装R及RStudio安装R安装RStudio之前需要先安装R。<1>添加镜像源添加镜像源到/etc/apt/sources.list注意Ubuntu版本(本人Ubuntu版本是xenial,即16.04。根据版本改变对应的名字。)# Ctrl+Alt+T打开终端$ sudo echo "deb http://cran.rstudio.com/bi

2016-12-13 16:57:20 30469 11

转载 如何选择机器学习算法

英文原文:Choosing a Machine Learning Classifier 译文原文:如何选择机器学习算法 How do you know what machine learning algorithm to choose for your classification problem? Of course, if you really care about accuracy, yo

2016-12-13 14:41:39 482

原创 Python生成词云——WordCount入门

主要内容:介绍词云用Python的WordCount包实现词云词云关键词的视觉化描述;图形可视化;用于汇总用户生成的标签或一个网站的文字内容;重要程度能通过改变字体大小或颜色来表现;大多数标签本身就是超级链接,直接指向与标签相联的一系列条目。Python实现词云构造词云的方法很多,这里推荐Python的WordCount包,实现非常方便,且能够自定义图片。具体可参考:WordCou

2016-12-13 13:43:47 4962 3

原创 在Ubuntu16.04中配置Anaconda(Python2.7)以支持Spark2.0(Pyspark)

本文主要内容:对比Spark和Hadoop介绍PysPark和Anaconda搭建并配置运行WordCount最近想学习大数据分析平台Spark,由于实验室设备不足,只能先在本地搭建一个独立式的Spark环境,进行简单分析,逐步探索Spark的奥秘,为以后Spark集群操作打好基础。 对于从事数据挖掘和机器学习人员来说,使用anaconda的ipython notebook无疑是最棒的体

2016-12-12 20:28:29 7708

原创 对Python中的Pandas进行SQL查询——pandasql

背景众所周知,用SQL语句进行数据查询十分方便,因为跟自然语言更接近。pandas其实是模仿R语言中的DataFrame设计的一个Python库。R语言中可以使用sqldf实现SQL查询;pandas中也有类似的库:pandasql。pandasql介绍Overview pandasql allows you to query pandas DataFrames using SQL sy

2016-12-05 20:27:53 28372 2

蓝牙协议的体系结构

主要包括两方面内容: 1、蓝牙技术 介绍蓝牙的起源、实质和蓝牙的技术特。 2、蓝牙协议体系 介绍蓝牙协议、蓝牙协议的体系结构以及核心协议。

2016-05-02

Hadoop2.6.0集群环境搭建

1.linux系统:Ubuntu14.04 2.hadoop版本:hadoop-2.2.0 3.JDK版本:Jdk1.8.0_74

2016-04-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除