自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Mysql数据库知识整理

近期想要做的事情1.将数据库知识进行整理,包括创建数据库,创建数据表,增删改查,数据表的连接join操作,视图,触发器,事务等。包括爬虫中跟数据库连接并存储数据,也就是所谓的ETL(数据获取,数据清洗,数据载入)。2.将Python与R的简单数据分析流程进行学习与整理。包括数据的载入,数据清洗,数据的初步统计描述,数据的建模分析。3.使用Python实践机器学习的几个重要算法,其中也包括数据的ETL

2017-10-29 21:09:55 549

转载 Python全局变量与局部变量的区别

1、函数内部的变量名如果第一次出现,且出现在=前面,即被视为定义一个局部变量,不管全局域中有没有用到该变量名,函数中使用的将是局部变量,例如:num = 100 def func(): num = 123 print(num)func() 输出:123说明函数中定义的num是一个局部变量,会将全局变量覆盖。再例如:num = 100 def func(): num

2017-10-14 22:33:38 543

原创 Selenium+Chrome(PhantomJs) Python爬虫

Ubuntu上搭建Selenium+ChromeSelenium的搭建:直接通过Pip进行安装 sudo pip install seleniumChrome浏览器需要安装ChromeDriver驱动来做web的自动化处理。1.首先需要根据需要安装Chrome浏览器,根据浏览器的版本信息,下载对应的chromedrver。浏览器的版本信息在setting中about chrome可以查询。 http

2017-10-14 14:46:19 348

原创 Ubuntu 16.04 Spark安装

Spark安装步骤:1:需要安装jdk,并配置环境变量2:安装Scala,并配置环境变量3:安装Spark,配置所要用的Python版本1.安装JDK首先来安装JDK: sudo mkdir /usr/lib/jdk在/usr/lib/目录下创建jdk文件夹,我们计划讲jdk安装在/usr/lib/jdk目录下。 切换至jdk-8u144-linux-x64.tar.gz的目录下 sudo tar

2017-10-09 12:30:53 2184 3

转载 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2017-10-09 11:43:26 170

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除