- 博客(10)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 Python操作MySQL
这篇文章主要记录如何使用Python操作MySQL数据库的基础知识点。准备工作在开始之前需要先安装MySQL数据库,以及应用模块MySQLdb。很简单:$ sudo apt-get install mysql-server$ sudo apt-get install python-mysqldb接下来,需要在MySQL中建立一个新的数据库testdb和新用户Do,以便操作。$ mysql -
2016-12-23 20:54:17 1047
原创 【Python那些事儿】Python中的生成器
生成器(generator)生成器,即生成一个容器。在Python中,一边循环,一边计算的机制,称为生成器。生成器可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他数据类型需要调用自己的内置iter()方法或__iter__()的内置函数),所以,生成器就是一个可迭代对象。在Python中,使用生成器可以很方便的支持迭代器协议。生成器优点python使用生成器对延迟操作提供了支
2016-12-21 20:08:33 3484
原创 【Python那些事儿】Python中的迭代器
主要记录:迭代器(iterator)协议对象必须提供一个next()方法,执行该方法时,要么返回迭代中的下一项,要么引起一个StopIteration异常。只能往前访问,不会后退。在Python中,支持迭代器协议就是实现对象的__iter__和next()方法。 __iter__方法:返回迭代器对象本身;next()方法:返回容器中的下一个元素,在结尾时引发StopIteration异常终
2016-12-21 17:25:28 3614
原创 MySQL into outfile 问题解决:ERROR 1 (HY000): Can't create/write to file
任务:从MySQL导数据导出数据到本地——select * into outfile '/home/spark/data.csv' fields terminated by ',' lines terminated by '\n' from mytable;错误信息:ERROR 1 (HY000): Can't create/write to file '/home/spark/data.csv'
2016-12-15 14:04:48 6814
原创 MySQL数据库操作
主要内容:MySQL安装基本MySQL命令行操作数据库知识数据库(database):即容器——保存有组织的数据;表(table):某种特定类型数据的结构化清单;模式(schema):关于数据库和表的布局及特性的信息;列(column):表中的一个字段,所有表都是由一个或者多个列组成的;数据类型(datatype):所容许的数据的类型。每个表列都有相应的数据类型,它限制该列中存储的数
2016-12-14 21:47:47 434
原创 Ubuntu16.04安装R及RStudio
主要内容:介绍在Ubuntu16.04上安装R及RStudio安装R安装RStudio之前需要先安装R。<1>添加镜像源添加镜像源到/etc/apt/sources.list注意Ubuntu版本(本人Ubuntu版本是xenial,即16.04。根据版本改变对应的名字。)# Ctrl+Alt+T打开终端$ sudo echo "deb http://cran.rstudio.com/bi
2016-12-13 16:57:20 30470 11
转载 如何选择机器学习算法
英文原文:Choosing a Machine Learning Classifier 译文原文:如何选择机器学习算法 How do you know what machine learning algorithm to choose for your classification problem? Of course, if you really care about accuracy, yo
2016-12-13 14:41:39 482
原创 Python生成词云——WordCount入门
主要内容:介绍词云用Python的WordCount包实现词云词云关键词的视觉化描述;图形可视化;用于汇总用户生成的标签或一个网站的文字内容;重要程度能通过改变字体大小或颜色来表现;大多数标签本身就是超级链接,直接指向与标签相联的一系列条目。Python实现词云构造词云的方法很多,这里推荐Python的WordCount包,实现非常方便,且能够自定义图片。具体可参考:WordCou
2016-12-13 13:43:47 4964 3
原创 在Ubuntu16.04中配置Anaconda(Python2.7)以支持Spark2.0(Pyspark)
本文主要内容:对比Spark和Hadoop介绍PysPark和Anaconda搭建并配置运行WordCount最近想学习大数据分析平台Spark,由于实验室设备不足,只能先在本地搭建一个独立式的Spark环境,进行简单分析,逐步探索Spark的奥秘,为以后Spark集群操作打好基础。 对于从事数据挖掘和机器学习人员来说,使用anaconda的ipython notebook无疑是最棒的体
2016-12-12 20:28:29 7710
原创 对Python中的Pandas进行SQL查询——pandasql
背景众所周知,用SQL语句进行数据查询十分方便,因为跟自然语言更接近。pandas其实是模仿R语言中的DataFrame设计的一个Python库。R语言中可以使用sqldf实现SQL查询;pandas中也有类似的库:pandasql。pandasql介绍Overview pandasql allows you to query pandas DataFrames using SQL sy
2016-12-05 20:27:53 28372 2
CSDN中编写公式,为何公式后面有一个竖杠?
2016-09-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人