数据分析
文章平均质量分 85
sixkery
在写 Java
展开
-
用数据揭秘《一出好戏》好在哪里
黄渤导演的处女作《一出好戏》在八月十号上映,两天累计票房4.37亿,豆瓣评分7.4,网友一片叫好,没想到拍出了一部魔幻现实主义的故事。下面我们用数据来展示一下网友的看法。获取数据这里选择用猫眼来获取网友的评论先来分析一下网页,打开猫眼一出好戏页面,发现只有几条评论。影评猫眼在没有登录的情况下并没有展现评论内容,我们换一种思路,用电脑模拟手机客户端来获取数据。 点击箭...原创 2018-08-12 15:16:28 · 510 阅读 · 0 评论 -
python数据清洗excel
python清洗excel的数据还是很简单的 这里就列举例子说一下 这是原始数据,这里要处理的是地区和薪水两个字段。 代码:import xlrdimport codecsimport redef get_salary(salary): # 利用正则表达式提取月薪,把待遇规范成千/月的形式 # 返回最低工资,最高工资的形式 if '-' in sala...原创 2018-09-11 20:08:53 · 15501 阅读 · 8 评论 -
处理数据
def get_area(area): #统计各个城市的个数 area_dict = {} for i in set(area): area_dict[i] = area.count(i) data = [] for item in area_dict: data.append((item,area_dict[item]...原创 2018-09-11 20:45:25 · 162 阅读 · 0 评论 -
python爬取前程无忧分析一波机械职位信息
秋招这个时候已经开始了,正所谓知己知彼方能百战不殆,今天就从招聘网站下手分析一波机械的就业前景。 这次获取数据的网站是前程无忧,之所以选择前程无忧,是因为数据获取没有什么难度,再者前程无忧提供的岗位信息比智联招聘,拉勾提供的数据都多。 看了一下,前程无忧提供了 2000页/50条 数据,考虑到数据可能有些重复,这里获取 48569 条数据。数据获取用到的爬虫框架是 scrapy ...原创 2018-09-10 23:31:50 · 923 阅读 · 0 评论 -
python 分析泰坦尼克号生还率
泰坦尼克号数据集,是kaggle(Titanic: Machine Learning from Disaster)上入门机器学习(ML)的一个好的可选数据集,当然,也是不错的练习数据分析的数据集。对 python ,在数据分析方面,作为一柄利器,涵盖了「数据获取→数据处理→数据分析→数据可视化」这个流程中每个环节,这个项目作为新生练习最好不过了。探索的问题主要探寻坦尼克号上的生还率和各因素(客...原创 2018-10-21 09:58:26 · 11633 阅读 · 3 评论 -
10 minutes of pandas
这是网上十分钟入门 pandas 的教程,在此手敲一遍。ps:这哪是十分钟,tm明明敲了好久,蓝瘦香菇。首先导入库:import pandas as pdimport numpy as npfrom matplotlib import pyplot as plt创建对象创建一个 series 通过传递值的列表,让 pandas 创建一个整数索引:s = pd.Series([1,...原创 2018-10-25 20:32:06 · 219 阅读 · 0 评论 -
pandas实战训练之招聘信息
pandas 练习的项目数据加载import pandas as pdimport numpy as npimport matplotlib.pyplot导入数据df = pd.read_csv('DataAnalyst.csv',encoding='gbk')df.head() city companyFullName...原创 2018-12-26 21:40:30 · 2302 阅读 · 0 评论 -
NumPy 总结
简介数据分析最重要的包是 NumPy 和 Pandas 。NumPy 是 Python 数值计算的扩展。NumPy 是 SciPy 、Pandas 等数据科学的基础库。它提供的数据结构比 Python 自身提供的数据结构更有效,速度快。NumPy 提供的数据结构是 Python 进行数据分析的基础。NumPy 运算效率比 Python 的 list 快很多,为啥快呢?因为底层实现的原...原创 2019-01-03 15:11:33 · 299 阅读 · 0 评论 -
sqlzoo.net 上面的题目解答
namecontinentAfghanistanAsiaAlbaniaEuropeAlgeriaAfricaAndorraEuropeAngolaAfricaname:國家名稱continent:洲份Pattern Matching Strings此教程使用LIKE運算子來檢查國家名字,我們會在world表格中運用SELECT語句:...原创 2018-12-25 10:41:21 · 2194 阅读 · 0 评论