2016年12月_积微成著

12月 11月 10月 09月 08月 07月 05月 04月

原创 Python操作MySQL

这篇文章主要记录如何使用Python操作MySQL数据库的基础知识点。准备工作在开始之前需要先安装MySQL数据库，以及应用模块MySQLdb。很简单：$ sudo apt-get install mysql-server$ sudo apt-get install python-mysqldb接下来，需要在MySQL中建立一个新的数据库testdb和新用户Do，以便操作。$ mysql -

2016-12-23 20:54:17 1047

原创【Python那些事儿】Python中的生成器

生成器（generator）生成器，即生成一个容器。在Python中，一边循环，一边计算的机制，称为生成器。生成器可以理解为一种数据类型，这种数据类型自动实现了迭代器协议（其他数据类型需要调用自己的内置iter（）方法或__iter__()的内置函数），所以，生成器就是一个可迭代对象。在Python中，使用生成器可以很方便的支持迭代器协议。生成器优点python使用生成器对延迟操作提供了支

2016-12-21 20:08:33 3484

原创【Python那些事儿】Python中的迭代器

主要记录：迭代器（iterator）协议对象必须提供一个next（）方法，执行该方法时，要么返回迭代中的下一项，要么引起一个StopIteration异常。只能往前访问，不会后退。在Python中，支持迭代器协议就是实现对象的__iter__和next（）方法。 __iter__方法：返回迭代器对象本身；next（）方法：返回容器中的下一个元素，在结尾时引发StopIteration异常终

2016-12-21 17:25:28 3614

原创 MySQL into outfile 问题解决：ERROR 1 (HY000): Can't create/write to file

任务：从MySQL导数据导出数据到本地——select * into outfile '/home/spark/data.csv' fields terminated by ',' lines terminated by '\n' from mytable;错误信息：ERROR 1 (HY000): Can't create/write to file '/home/spark/data.csv'

2016-12-15 14:04:48 6814

原创 MySQL数据库操作

主要内容：MySQL安装基本MySQL命令行操作数据库知识数据库（database）：即容器——保存有组织的数据；表（table）：某种特定类型数据的结构化清单；模式（schema）：关于数据库和表的布局及特性的信息；列（column）：表中的一个字段，所有表都是由一个或者多个列组成的；数据类型（datatype）：所容许的数据的类型。每个表列都有相应的数据类型，它限制该列中存储的数

2016-12-14 21:47:47 434

原创 Ubuntu16.04安装R及RStudio

主要内容：介绍在Ubuntu16.04上安装R及RStudio安装R安装RStudio之前需要先安装R。<1>添加镜像源添加镜像源到/etc/apt/sources.list注意Ubuntu版本（本人Ubuntu版本是xenial，即16.04。根据版本改变对应的名字。）# Ctrl+Alt+T打开终端$ sudo echo "deb http://cran.rstudio.com/bi

2016-12-13 16:57:20 30470 11

转载如何选择机器学习算法

英文原文：Choosing a Machine Learning Classifier 译文原文：如何选择机器学习算法 How do you know what machine learning algorithm to choose for your classification problem? Of course, if you really care about accuracy, yo

2016-12-13 14:41:39 482

原创 Python生成词云——WordCount入门

主要内容：介绍词云用Python的WordCount包实现词云词云关键词的视觉化描述；图形可视化；用于汇总用户生成的标签或一个网站的文字内容；重要程度能通过改变字体大小或颜色来表现；大多数标签本身就是超级链接，直接指向与标签相联的一系列条目。Python实现词云构造词云的方法很多，这里推荐Python的WordCount包，实现非常方便，且能够自定义图片。具体可参考：WordCou

2016-12-13 13:43:47 4964 3

原创在Ubuntu16.04中配置Anaconda（Python2.7）以支持Spark2.0（Pyspark）

本文主要内容：对比Spark和Hadoop介绍PysPark和Anaconda搭建并配置运行WordCount最近想学习大数据分析平台Spark，由于实验室设备不足，只能先在本地搭建一个独立式的Spark环境，进行简单分析，逐步探索Spark的奥秘，为以后Spark集群操作打好基础。对于从事数据挖掘和机器学习人员来说，使用anaconda的ipython notebook无疑是最棒的体

2016-12-12 20:28:29 7710

原创对Python中的Pandas进行SQL查询——pandasql

背景众所周知，用SQL语句进行数据查询十分方便，因为跟自然语言更接近。pandas其实是模仿R语言中的DataFrame设计的一个Python库。R语言中可以使用sqldf实现SQL查询；pandas中也有类似的库：pandasql。pandasql介绍Overview pandasql allows you to query pandas DataFrames using SQL sy

2016-12-05 20:27:53 28372 2

蓝牙协议的体系结构

主要包括两方面内容： 1、蓝牙技术介绍蓝牙的起源、实质和蓝牙的技术特。 2、蓝牙协议体系介绍蓝牙协议、蓝牙协议的体系结构以及核心协议。

2016-05-02

Hadoop2.6.0集群环境搭建

1.linux系统:Ubuntu14.04 2.hadoop版本:hadoop-2.2.0 3.JDK版本:Jdk1.8.0_74

2016-04-28

CSDN中编写公式，为何公式后面有一个竖杠？

2016-09-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人