排序:
默认
按更新时间
按访问量

前程无忧数据分析招聘信息分析

近期想找数据分析方面的工作,又苦于没有工作经验,在老司机的指导下,我尝试将招聘网站前程无忧上广州数据分析岗位的部分数据用爬虫获取并进行了简单的数据分析。一、数据获取不得不说,前程无忧几乎没有反爬虫机制,我写了一个很简陋的爬虫代码就爬了约900条数据下来。这次分析的目的是了解目前市场对数据分析人才的...

2018-07-05 21:33:10

阅读数:532

评论数:0

SQL练习

SELECT基础操作world表1、查询所有国家名字,条件是首都名是国家名加上' City'。SELECT NAME FROM WORLD WHERE CAPTIAL = CONCAT(NAME,'CITY');2、找出所有首都和国家名字,首都名要有国家名出现。SELECT capital,nam...

2018-06-24 15:08:03

阅读数:175

评论数:0

利用python进行数据分析学习笔记1(pandas入门)

pandas引入import pandas as pdSeries和DataFrame用的比较多from pandas import Series,DataFramepandas的数据结构介绍Series类似一维数组的对象,由一组数据和索引组成。传入一个列表作为Series的参数创建Seires。...

2018-06-24 15:04:44

阅读数:71

评论数:0

利用python进行数据分析学习笔记1(NumPy)

常用模块的命名惯例import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsimport statsmodels as smnumpy基础NumPy的ndarray是一种多维数组...

2018-06-24 15:04:42

阅读数:103

评论数:0

利用python进行数据分析学习笔记1(数据加载,存储与文件格式)

读写文本格式的数据将工作目录下的一个csv文件读入一个DataFrame中df = pd.read_csv('examples/ex1.csv')也可以是哟个read_table方法,并指定分隔符pd.read_table('examples/ex1.csv',sep=',')有些数据文件没有标题...

2018-06-24 15:04:39

阅读数:88

评论数:0

利用python进行数据分析学习笔记1(数据清洗和准备)

处理缺失数据创建一个含缺失值的Seriesstring_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado']) string_data.isnull()通过isnull方法返回一个布尔型Series,缺失值显示为True。通过索...

2018-06-24 15:04:36

阅读数:165

评论数:0

利用python进行数据分析学习笔记(数据规整:聚合、合并和重塑)

层次化索引data = pd.Series(np.random.randn(9), index=[['a','a','a','b','b','c','c','d','d'], [1,2,3,1,3,1,2,2,3]]) data....

2018-06-24 15:04:34

阅读数:55

评论数:0

利用python进行数据分析学习笔记(绘图和可视化)

matplotlib API入门引入matplotlibimport matplotlib.pyplot as plt创建一个简单的图形data = np.arange(10) plt.plot(data)Figure和Subplotmatplotlib的图像都位于Figure对象中,可以用plt...

2018-06-24 15:04:31

阅读数:132

评论数:0

利用python进行数据分析学习笔记(数据聚合与分组运算)

GroupBy机制df = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], '...

2018-06-24 15:04:29

阅读数:103

评论数:0

商务与经济统计阅读笔记3

简单线性回归回归分析:利用统计学方法来建立一个表示变量间相互关系的方程。被预测的变量称为因变量,用来预测的是自变量。14.1 简单线性回归模型ε是一个随机变量,称为模型的误差项,包含在y中,但是不能被x和y之间的线性关系解释的变异性。估计的回归方程,用样本统计量b0和b1来作为总体参数β0和β1的...

2018-06-24 15:04:10

阅读数:62

评论数:0

商务与经济统计阅读笔记1

统计是搜集、分析、表述和解释数据的艺术和科学。描述统计用表格、图形和数值方法来汇总数据。统计推断是利用样本数据估计总体特征并进行假设检验的过程。汇总分类变量的数据:频数分布,相对频数分布和百分数频数分布,条形图和饼形图。汇总数量变量的数据:频数分布,相对频数分布和百分数频数分布,打点图,直方图,累...

2018-06-24 15:04:09

阅读数:73

评论数:0

商务与经济统计阅读笔记2

因为不能期望点估计量能给出总体参数的精确值,故常在点估计量上加减一个边际误差来计算区间估计。8.1 当总体标准差已知时,总体均值的区间估计区间估计1-α表示置信系数。比如置信系数为0.95时,则这个区间称为95%的置信区间,有95%的把握相信区间内包含总体均值μ。或者换种说法,从区间中随机取100...

2018-06-24 15:04:07

阅读数:63

评论数:0

SQL必知必会学习笔记

主键:一列(或一组列),其值可以唯一标识表中每一行。用SELECT语句检索数据SELECT prod_name FROM Products;表示从Products表中检索一个名为prod_name的列,结果会返回prod_name列。SELECT prod_id,prod_name,prod_pr...

2018-06-24 15:03:42

阅读数:92

评论数:0

王佩丰数据透视表(六到十一讲)

动态引用数据源区域。结合新建名称和offset函数,设置一个动态数据区域。插入数据透视表时引用这个名称即可。Gerpivotdata函数可以动态地引用数据透视表中的数据,默认是开启的。举个例子,在透视表外引用单元格B5,会显示即动态引用常熟区域的彩盒金额,此后如果常熟和彩盒的顺序改变了,该单元格也...

2018-06-24 15:03:35

阅读数:175

评论数:0

王佩丰数据透视表(一到五讲)

创建数据透视表选中数据区域,然后插入数据透视表即可。自定义字段到透视表中,双击值字段中的数据,可以跳转到该数据的数据源。避免源数据泄漏:复制粘贴时仅粘贴表格中的数据。如果删除掉字段中的某个项目,下拉框中还会显示出来。比如以部门为行字段,删除掉源数据中的四科,下拉框中还有,此问题可以在数据透视表选项...

2018-06-24 15:03:33

阅读数:295

评论数:3

王佩丰excel2010基础教程学习笔记(最后几讲图表的)

创建经典动态图通过勾选复选框选择数据是否出现。首先建立两个复选框,并将其值关联到两个单元格。新建名称彩盒和宠物用品,如果复选框关联的单元格的值为True时就引用数据区域,否则引用空白的数据区域。新建一个空白折线图,右键选择数据源,添加新的图例项。系列名称是定义好的名称,系列值是工作表名加定义好的名...

2018-06-24 15:03:22

阅读数:157

评论数:0

王佩丰excel2010基础教程学习笔记(第十一讲到第十五讲)

vlookup()函数,纵向查找函数。举个例子=VLOOKUP(G6,$B$6:$E$10,4,0)参数一是要查找的值,参数二是要查找的区域,参数三是返回查找区域的第几列,参数四是精确匹配还是模糊匹配。注意,查找的值必须位于查找区域的第一列。参数二可以在其他工作表。参数四为0时表示精确匹配,1表示...

2018-06-24 15:03:19

阅读数:125

评论数:0

王佩丰excel2010基础教程学习笔记(第十六讲到第二十讲)

简单文本函数:left,right,mid,findleft()函数有两个参数,参数一是字符串所在单元格,参数二是从字符串左边开始取几位。从字符串左边开始取三位。right()函数一样,不过是从字符串右边开始取。从字符串右边开始取四位。mid()函数有三个参数,参数一是字符串所在单元格,参数二是从...

2018-06-24 15:03:15

阅读数:155

评论数:0

王佩丰excel2010基础教程学习笔记(第六讲到第十讲)

选中数据所在区域,选择插入——数据透视表即可生成数据透视表。——将字段放入选定的区域,可以自由定制透视表。在值字段区域右键可以选择不同的显示和汇总方式。双击值字段的数据可以获取其源数据。行列字段的分组设定:通过分组可以将字段按照步长分为多个区域,再汇总各区域中的数据。比如将金额移植到行字段,通过分...

2018-06-24 15:03:01

阅读数:110

评论数:0

王佩丰excel2010基础教程学习笔记(第一讲到第五讲)

全部重排:打开两个或以上excel表格时,通过全部重排可以全部呈现在屏幕上。如将三个excel表格垂直并排。选择视图中的全部重排。再选择垂直并排。冻结窗格:此选项可以冻结首行首列,或者冻结选中单元格的左侧的列和上侧的行。填充柄:在单元格中输入数据,右键单元格右下角往下拉会出现填充柄。在单元格内按A...

2018-06-24 15:02:55

阅读数:206

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭