娇兮心有之的博客

Python路上,你我同行!

爬取了 48048 条评论数据,解读 9.3 分的《毒液》是否值得一看?

11月,由汤姆·哈迪主演的“毒液:致命守护者”在国内上映,依托漫威的光环以及演员们精湛的演技,这部动作科幻片在猫眼评分得到豆瓣7.4的评分,口碑和票房都高于大多数同期上 11月,由汤姆·哈迪主演的“毒液:致命守护者”在国内上映,依托漫威的光环以及演员们精湛的演技,这部动作科幻片在猫眼评分得到豆瓣...

2019-05-25 15:20:15

阅读数 50

评论数 0

Python数据分析之pandas学习

一、数据结构介绍 在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame。Series类似于numpy中的一维数组,除了通吃一维数组可用的函数或方法,而且其可通过索引标签的方式获取数据,还具有索引的自动对齐功能;DataFrame类似于numpy中的二维数组,同样...

2019-05-09 15:05:21

阅读数 96

评论数 0

Python数据分析之numpy学习

Python模块中的numpy,这是一个处理数组的强大模块,而该模块也是其他数据分析模块(如pandas和scipy)的核心。 接下面将从这5个方面来介绍numpy模块的内容: 1)数组的创建 2)有关数组的属性和函数 3)数组元素的获取--普通索引、切片、布尔索引和花式索引 4)统计函...

2019-05-09 15:04:26

阅读数 69

评论数 0

预测python数据分析师的工资

一、对薪资进行转换 在这之前先导入模块并读入文件,不仅有训练数据文件,还有一组自拟的测试数据文件。 为了更好地进行分析,我们要对薪资做一个预处理。由于其分布比较散乱,很多值的个数只有1。为了不造成过大的误差,根据其分布情况,可以将它分成【5k 以下、5k-10k、10k-20k、20k-3...

2019-04-21 15:18:18

阅读数 227

评论数 1

python3 对拉勾数据进行可视化分析

上回说到我们如何如何把拉勾的数据抓取下来的,既然获取了数据,就别放着不动,把它拿出来分析一下,看看这些数据里面都包含了什么信息。 一、前期准备 由于上次抓的数据里面包含有 ID这样的信息,我们需要将它去掉,并且查看描述性统计,确认是否存在异常值或者缺失值。 结果中的 uniqu...

2019-04-21 15:14:14

阅读数 105

评论数 0

Python数据分析工具安装集合

用Python做数据分析离不开几个好的轮子(或称为科学棧/第三方包等),比如matplotlib,numpy, scipy, pandas, scikit-learn, gensim等,这些包的功能强大,丰富,包括含了绘图,机器学习,爬虫,数据分析等等。而开发工具推荐使用pycharm或者Jupy...

2019-04-07 16:17:50

阅读数 117

评论数 0

Python数据分析三板斧

前言 天下武功中,哪个是最简单,最实用的了?那当然是程咬金的三板斧。传说中,程咬金晚上睡觉,梦见一老神仙,教了他三十六式板斧,这套功夫威力极大,而且招式简单,十分适合程咬金,但是程咬金醒来之后就只记住了三招,便有了这三板斧。就是这简单的三板斧,帮助李世民建立大唐江山。 这个教程将以简单,有效,...

2019-04-04 15:21:26

阅读数 65

评论数 0

Python常见的pandas用法demo示例

本文实例总结了Python常见的pandas用法。分享给大家供大家参考,具体如下:

2019-04-01 15:00:36

阅读数 24

评论数 0

用Python做数据分析:Pandas常用数据查询语法

在使用Pandas之前,大多数数据分析师已经掌握了Excel和SQL,并且在刚上手Pandas时会经常习惯性想到“老办法”。"如果谁能把常用的数据查询语法做个对比就好了 ",我也曾不止一次地想享受前人的成果,无奈发现网上的文章侧重不同且深浅不一,还涉及到一些Pandas新老版本...

2019-03-23 14:52:32

阅读数 119

评论数 0

python爬取热门微博评论并对其进行数据可视化

在爬取数据的时候会面临几个问题: 1.存储选择 我这里选用了MongoDB作为数据存储,因为api通常返回的是json数据而json结构和MongoDB的存储方式可以结合的很默契,不需要经过任何处理可以直接的进行插入。 2.防爬虫 很多网站可能会做一些防爬虫的处理,面对同一个请求ip的短时...

2019-03-19 14:00:07

阅读数 138

评论数 0

Python与R的争锋:大数据初学者该怎样选?

在当下,人工智能的浪潮席卷而来。从AlphaGo、无人驾驶技术、人脸识别、语音对话,到商城推荐系统,金融业的风控,量化运营、用户洞察、企业征信、智能投顾等,人工智能的应用广泛渗透到各行各业,也让数据科学家们供不应求。Python和R作为机器学习的主流语言,受到了越来越多的关注。数据学习领域的新兵们...

2019-03-14 15:47:57

阅读数 76

评论数 0

使用Pandas更好的做数据科学

作者: Kevin Markham 不管英语好不好,建议大家去看看这个教程,全部下来大概一个小时时间。我看完之后惊呆了,发现pandas居然还可以这么玩。我就列几个印象深刻的神功能。 想要学习Python?Python学习交流群:984632579满足你的需求,资料都已经上传群文件,可以自行...

2019-03-13 13:11:57

阅读数 88

评论数 0

2019年,这5个数据科学项目能帮你找到工作

数据清洗 数据科学家往往要耗费高达80%的时间来清理新项目的数据,这是数据科学团队最大的痛点。如果能告诉他们你拥有丰富的数据清理经验,你的价值马上就能体现出来了。现在,找一些需要清理的数据集,创建一个数据清洗项目,开始数据清理吧。 用Python的话,Pandas绝对是首选,如果用的是R,...

2019-01-22 10:29:32

阅读数 139

评论数 0

数据分析师进阶必备6大数学利器

原文链接:www.kdnuggets.com 原文作者: Tirthajyoti Sarkar 介绍 数学是现代科学的基石,几乎所有现代科学都与数学密不可分,尤其是数据科学与机器学习。 要想成为资深数据分析师,必须具备一定的数学知识,熟练应用数学技巧,才能更好地使用程序自带的算法。比如说,...

2019-01-21 14:40:42

阅读数 135

评论数 0

Python爬取房产数据,在地图上展现!

这次我们写的是用python爬虫爬取乌鲁木齐的房产数据并展示在地图上,地图工具我用的是 BDP个人版-免费在线数据分析软件,数据可视化软件 ,这个可以导入csv或者excel数据。 首先还是分析思路,爬取网站数据,获取小区名称,地址,价格,经纬度,保存在excel里。再把excel数据上传...

2019-01-16 14:53:21

阅读数 456

评论数 0

新闻联播也可以拿用Python来做数据分析?

数据准备 获取近10年的新闻联播文本有两个方法,一是自己写爬虫,将CCTV网站的新闻联播网页爬取下来,二是通过Tushare SDK的API免费获取数据。 如果是自己爬,好处是可以锻炼自己的爬虫编程能力,磨练自己被可能不统一的网页格式虐心千百遍还不砸电脑的心态意志。 坏处是爬数据,清洗数据确...

2019-01-16 14:45:55

阅读数 346

评论数 0

几款数据可视化的工具介绍

DT(Data Technology)时代已经来临,使用BI工具代替手工统计分析数据,已经成为企业和政府快速致胜的武器。好的BI工具能有效的帮助企业提高分析效率、减少分析成本、提高数据价值、完善信息化水平。 新型的数据可视化产品层出不穷,基本上各种语言都有自己的可视化库,传统数据分析及BI软件也...

2019-01-15 19:57:53

阅读数 1197

评论数 1

Tableau官方推荐:12本关于数据可视化的好书

你想了解更多关于数据可视化的理论知识和历史背景吗?你想受到令人惊叹的可视化示例的启发吗?你希望能够创建更有效的可视化效果吗?或者你是否有兴趣从权威部门获取有关数据可视化的信息吗? 如果有,那么本文就是专门为你准备的,tableau近日列出了在过去几年中对他们非常有帮助的数据可视化书籍,希望对你们...

2019-01-15 19:55:18

阅读数 1147

评论数 5

分享 :Python数据可视化专家的七个秘密

秘密一: 现实中的数据往往很丑 大部分的数据可视化的教程, 都会让你轻松地从一个原始数据集开始。 无论你是学习基本的柱状图还是力导向的网络图, 你的数据都是干净的,经过整理的数据。 这些完美的JSON或者CSV文件就像电视里的厨艺节目中的灶台那样干净整洁。而实际上, 当你在处理现实中的真正的数据...

2019-01-15 19:51:39

阅读数 1237

评论数 0

Python数据可视化:2018年北上广深空气质量分析

就在这周偶然看到一个学弟吐槽天津的空气,不禁想起那段厚德载雾,自强不吸的日子。 无图无真相,下图为证。   左边的图是去年2月份的时候,这样的空气真的难得一见! 右边的是吐槽以及我个人第一次买口罩!!! 口罩用的还行,因为那个时候做课设,经常要两个校区跑,基本上空气不好我就会带上。 ...

2019-01-15 19:46:49

阅读数 528

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭