python数据分析
本专栏旨在整理我从python从头学习数据分析的过程,涉及python基础、工具包的使用、爬基础以及实战小案例。记录从小白慢慢入门,并逐步成长的过程。
mini猿要成长QAQ
一步一步脚印,踏踏实实向前~~~
展开
-
在pycharm中切换python版本的方法
目前,python2和python3都有很重要的意义,所以,我们经常会在电脑上同时安装python的两个版本或者更多。如何根据项目需要切换所使用的python版本呢?? 接下来,我将介绍如何利用pycharm这个IDE进行python版本的切换。 我使用的pycharm版本是下面这个,不同版本之间可能有所差异: 可以看到,目前我使用的python版原创 2017-09-07 09:14:00 · 166629 阅读 · 5 评论 -
同时装了Python3和Python2,怎么用pip
1、添加python2到系统环境变量 打开,控制面板\系统和安全\系统,选择高级系统设置,环境变量,选择Path,点击编辑,新建,分别添加D:\Python\python27和D:\Python\python27\Scripts到环境变量。注意:python3安装时可以选择自动添加到系统环境变量,如未选择,方法和python2添加过程相同。2、修改python.exe名字为p转载 2017-09-13 18:56:15 · 5953 阅读 · 1 评论 -
Windows7 64位+python3.4环境下安装opencv3.0的方法
本文转载自天地一扁舟在win7 64位系统下+python3.4环境下安装opencv3.0主要过程如下:首先在windows的python扩展包网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/中下载opencv3.0的安装包如下图所示我根据自己的系统,选择下载: opencv_python-3.1.0-cp34-c转载 2017-09-13 16:03:09 · 544 阅读 · 0 评论 -
windows下的python+ opencv安装攻略
准备文件:python2.7.12,下载链接https://www.python.org/downloads/pip8.1.1,下载链接https://pypi.python.org/packages/41/27/9a8d24e1b55bd8c85e4d022da2922cb206f183e2d18fee4e320c9547e751/pip-8.1.1.tar.gz#md5=6b86f11转载 2017-09-13 15:50:00 · 557 阅读 · 0 评论 -
MySQL免安装版本配置教程及错误解决方案
这次话不多说,直接上步骤 1、下载。https://dev.mysql.com/downloads/mysql/ 2、解压,将bin目录,添加到系统变量的path中。 3、修改my-default.ini配置文件,修改之后如下:(如果没有,就照着打一份就行了,也就四行语句,但要注意,保存的时候,编原创 2017-09-07 18:43:36 · 928 阅读 · 0 评论 -
kaggle 注册无法激活的问题解决
跟着DC学院的数据分析师课程,需要在kaggle上下载一个数据集。想到自己的kaggle账户还未激活,于是乎前往激活。在激活的过程中,总是提示未输入正确验证码,关键是我也没有输入验证码,并且没有地方让我输入验证码。(忘记截图了,反正就是一个空空如也,只要一个confirm按钮的界面,如果你搜索到这里,一定是遇到了那个可恶又尴尬的界面......)后来查了一下才知道,目前不翻墙是无法激活kagg原创 2017-09-12 09:47:46 · 25401 阅读 · 18 评论 -
DC学院数据分析师(入门)学习笔记----基于网站API抓取《摔跤吧!爸爸》的豆瓣评分情况
前几天在某公众号上看到了对《战狼2》的数据分析,涉及人群,观看时间,影评,地点等等,分析的超级棒,所以就想着数据分析是一件很有说话权的事情。作为这方面的小白,决定抽时间学习一番。于是乎,通过博客来记录一下自己的学习路程。 其实就是跟着网课的操作笔记 这次是基于网站API抓取《摔跤吧!爸爸》的豆瓣评分情况 首先,我们需要了解豆瓣API的说明。豆瓣API说明:ht原创 2017-09-06 11:33:45 · 1257 阅读 · 0 评论 -
DC学院数据分析师(入门)学习笔记----基于网页抓取天气数据demo以及基于网页抓取《摔跤吧!爸爸》豆瓣评分
课程示例的旧金山天气页面地址为:http://forecast.weather.gov/MapClick.php?lat=37.77492773500046&lon=-122.41941932299972#.WUnSFhN95E4 在火狐浏览器中提供了非常方便的网页代码查看器(其他浏览器可自行百度): 这样我们可以很快速地知道我们想获取的信息在htm原创 2017-09-06 16:55:20 · 526 阅读 · 0 评论 -
DC学院数据分析师(入门)学习笔记----高级爬虫技巧
对于网站来说,实际上是不愿意让大家去爬取它的内容的,因为爬虫可能会对真实的用户带来不太好的影响(很多网站会限制流量,尤其是对爬虫产生的流量,会对服务器带来一定的压力)。所以网站会对爬虫有一定的抵制,如果不注意爬虫的技巧,有可能就被网站封杀IP,以致暂停了。 那么如何能够轻松绕过部分的反爬虫限制,书写我们的爬虫呢?? 1.设定程序休止时间原创 2017-09-07 10:46:30 · 6956 阅读 · 0 评论 -
DC学院数据分析师(入门)学习笔记----利用python操作MySQL数据库
安装pymysql原理介绍:使用pymysql指令来连接数据库host:要连接的数据库的IP地址,如果是远程的,这里指定远程的ip地址user:登录的账户名,如果登录的是最高权限账户则为rootpassword:对应的密码db:要连接的数据库的名称,如需要访问存储的IRIS数据库,则输入'IRIS'charset:设置编码格式,如utf8原创 2017-09-08 11:57:47 · 2756 阅读 · 3 评论 -
python爬取网易云音乐薛之谦歌词数据,生成词云
老薛最近频频上热搜,因为老薛的歌大部分是自己作词,所以感觉他的歌词和他应该有某种情感表达和联系吧。于是用python爬了网易云音乐中老薛的歌词数据,并简单用wordcloud写了个词云统计。难过,害怕,离开,分开,爱情,思念等词出现频繁,希望如作词所写,是个真真实实重感情的人吧。(应该扣个图的,词云显示的不像老薛的照片....)先上个词云图吧,以后如果有需要,再写详细的代码解释。原创 2017-09-14 15:34:11 · 4423 阅读 · 2 评论 -
XGBoost资料( 多届竞赛冠军获得者 周耀 整理)
XGBoost原理《xgboost导读和实战》《Introduction to Boosted Trees》自定义目标函数机器学习算法中GBDT和XGBOOST的区别有哪些?DARTXGBoost: Reliable Large-scale Tree Boosting SystemXGBoost: A Scalable Tree Boosting Systemxgboost参数介绍xg转载 2017-09-12 17:19:21 · 763 阅读 · 0 评论