- 博客(5)
- 收藏
- 关注
原创 Mysql数据库知识整理
近期想要做的事情1.将数据库知识进行整理,包括创建数据库,创建数据表,增删改查,数据表的连接join操作,视图,触发器,事务等。包括爬虫中跟数据库连接并存储数据,也就是所谓的ETL(数据获取,数据清洗,数据载入)。2.将Python与R的简单数据分析流程进行学习与整理。包括数据的载入,数据清洗,数据的初步统计描述,数据的建模分析。3.使用Python实践机器学习的几个重要算法,其中也包括数据的ETL
2017-10-29 21:09:55 549
转载 Python全局变量与局部变量的区别
1、函数内部的变量名如果第一次出现,且出现在=前面,即被视为定义一个局部变量,不管全局域中有没有用到该变量名,函数中使用的将是局部变量,例如:num = 100 def func(): num = 123 print(num)func() 输出:123说明函数中定义的num是一个局部变量,会将全局变量覆盖。再例如:num = 100 def func(): num
2017-10-14 22:33:38 543
原创 Selenium+Chrome(PhantomJs) Python爬虫
Ubuntu上搭建Selenium+ChromeSelenium的搭建:直接通过Pip进行安装 sudo pip install seleniumChrome浏览器需要安装ChromeDriver驱动来做web的自动化处理。1.首先需要根据需要安装Chrome浏览器,根据浏览器的版本信息,下载对应的chromedrver。浏览器的版本信息在setting中about chrome可以查询。 http
2017-10-14 14:46:19 348
原创 Ubuntu 16.04 Spark安装
Spark安装步骤:1:需要安装jdk,并配置环境变量2:安装Scala,并配置环境变量3:安装Spark,配置所要用的Python版本1.安装JDK首先来安装JDK: sudo mkdir /usr/lib/jdk在/usr/lib/目录下创建jdk文件夹,我们计划讲jdk安装在/usr/lib/jdk目录下。 切换至jdk-8u144-linux-x64.tar.gz的目录下 sudo tar
2017-10-09 12:30:53 2184 3
转载 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2017-10-09 11:43:26 170
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人