数据分析
sl01224318
这个作者很懒,什么都没留下…
展开
-
Python字段数据保存到excel表格
前言在日常测试中我们会遇到将获取的数据保存到excel中,例如通过Pthon的request请求获取的数据,那么我们可以通过以下方法进行处理。数据处理我们可以将获得的数据以字典的形式进行存储,例如:data1 = {"key1":["test1","test2","test3"], "key2":["test4","test4","test6"], "key3":["test7","test8","test9"]}...原创 2022-02-19 22:55:59 · 9025 阅读 · 0 评论 -
Pandas—时间序列
背景在日常数据分析中,我们会做到以下一些任务,如:生成固定频率日期和时间跨度的序列将时间序列整合或转换为特定频率基于各种非标准时间增量(例如,在一年的最后一个工作日之前的5个工作日)计算“相对”日期,或向前或向后“滚动”日期。这是我们可以用到pandas的date_range来进行处理。使用方法1、生成一段时间范围该函数主要用于生成一个固定频率的时间索引,在调用固定方法时,必须指定start,end,per...原创 2022-01-16 19:25:02 · 1052 阅读 · 0 评论 -
设置jupyter notebook文件保存位置
默认位置 在安装完jupyter notebook后,新建文件一般会默认存储在C盘某个位置,此时可以通过os模块来查看新建的文件保存路径,具体如下:首先新建一个.ipynb文件,然后输入以下代码,然后运行此代码,可以看到文件存储的路径在C盘下面。import osprint(os.path.abspath('.'))修改文件存储路径如果我们需要修改文件存储路径怎么办呢吗,那可以通过以下方法进行修改文件存储路径。step1:找到配置文...原创 2021-12-26 13:24:26 · 22018 阅读 · 14 评论 -
jupyter一直在运行,不出结果
问题启动jupyter运行代码时,代码一直在运行中,而且一直显示*,提示“WebsocketProtocol is not connected”解决方法安装notebook的6.1.4版本,命令如下:1、pip uninstall notebook2、pipinstall notebook=6.1.4安装完成后重新启动jupyter即可。...原创 2021-12-18 19:39:01 · 11183 阅读 · 2 评论 -
jupyter-notebook not found
前言在使用pip install jupyter命令安装jupyter后,然后在cmd终端中输入“jupyter notebook”后,提示Jupyter command 'notebook': Errno 'jupyter-notebook' not found,现将解决方法总结如下。解决方法1、卸载jupyter后重新安装,命令如下:pip install jupyter notebook2、安装对应的tornado版本查看自己的tornado版本,将安装的tornado版本升原创 2021-12-18 19:15:58 · 6725 阅读 · 0 评论 -
公司诉讼案件分析
背景:最近从某个数据网站获取到一份关于公司诉讼案件的数据表,在这里和大家分享一下我的分析方法。数据清洗:首先我们看一下数据信息,在这里我们需要以时间列作为索引,并把不需要的数据进行删除。data = pd.read_csv(r'E:\DataAnalysis\illegal_company.csv')data.head(2)# 将立案时间类型转换为datetimedata['立案时间'] = pd.to_datetime(data['立案时间'])#设置索引,以立案.原创 2020-09-13 13:57:40 · 853 阅读 · 0 评论 -
Pandas: TypeError: unorderable types: str() < float()
错误描述:TypeError: unorderable types: str() < float()问题描述:在进行数据分析时,想要使用resample方法进行定时采样,代码如下,但是运行时报了这样的错误“TypeError: unorderable types: str() < float()”。score_by_time = data['score'].resample('H').mean() #可以看出2019-02-06 04:00:00评论平均分最高s..原创 2020-08-29 11:40:22 · 1251 阅读 · 0 评论 -
TypeError: argument of type ‘float‘ is not iterable报错的解决方法
上周在进行数据分析联系时,遇到这样一个问题,先来看下看些报错原因。报错原因是“TypeError: argument of type 'float' is not iterable”意思是float型不能进行迭代。报错原因是数据中含有float型数据,需要使用astype方法进行数据类型准换成str运行即可。报错的代码:auth_capital['ex_rate'] = auth_capital[1].apply(get_ex_rate) auth_capital.sample(5)原创 2020-08-23 15:45:10 · 43969 阅读 · 9 评论 -
儿科医生在国内需求分析
前言数据清洗去重创建、更新时间 数据类型转换省份、市区清理处理工资字段数据分析儿科医生的需求儿科医生招聘经验要求儿科医生学历高吗职称对儿科医生高吗儿科的工资待遇怎么样?相当工资,医院对学历、职称等要求如何?各地方省市对儿科医生的需求儿科医生的要求和福利总结前言这周跟着“[Alfred数据室]”分析了一篇关于儿科医生这个职位在国内的招聘要求、薪资水平、在医生招聘中所占比例等,今天把学到的和写的代码数据和大家做个分享,废话不多说,直接上代码来分原创 2020-08-16 21:25:46 · 1719 阅读 · 1 评论 -
没经验学历的外教竟然这么吃香,我酸了!
背景:这几天拿到了一份关于“英语外籍老师与本土老师招聘数据在中国的工作情况”的数据(没经验没学历的外教为啥能拿1.4W+的高薪?),这些数据是我在Github上找到的,有需要的可以留言,后面可以把相关数据分享和你们,大家也可以关注原作者的微信公众号“[Alfred数据室]”查看相关数据。介绍说明:首先我们先看下这几个excel表格,“外语培训”是记录一些培训院校对外语教师的招聘添加、城市、经验和学历要求,“幼儿园”表格是记录幼儿园学校对外语教师的招聘要求,同理“职业学院”和“中小学”也是对外语教原创 2020-08-10 23:02:36 · 333 阅读 · 0 评论 -
求2个数的最小公倍数
题目:正整数A和正整数B的最小公倍数是指能被A和B整除的最小的正整数值,设计一个算法,求输入A和B的最小公倍数。解题思路:使用之前学习过的数学知识,最小公倍数 = 两数之积除以最大公约数。代码部分:a, b = [int(i) for i in input().strip().split(" ")]s = min(a,b)for i in range(s,0,-1): if a%i==0 and b%i==0: breakprint(int(a*b/i))...原创 2020-08-02 10:31:23 · 1048 阅读 · 0 评论 -
数据分析-numpy学习
今天和大家分享下最近学习的一些numpy知识,这些都是我一个一个手动码出来的,有兴趣的同事可以一起学习一下。创建一维数据创建二维数组常用属性调整数组的形状将数组转换成list形式 数组和数的计算三维数组数组的索引与切片数组中数值的修改数组的添加、删除与去重numpy的计算数组的拼接二维数组的转置创建一维数据import numpy as nplist1 = [1,2,3,4]oneArray = np.array(list1)print(..原创 2020-07-18 22:08:42 · 173 阅读 · 0 评论