- 博客(6)
- 收藏
- 关注
原创 BOSS招聘中数据分析岗位分析
data=data[data['职位'].str.contains('数据分析',na=True)&~data['职位'].str.contains('兼职',na=True)&~data['职位'].str.contains('实习',na=True)]#筛选数据分析且不包含兼职的岗位。data['s_mean']=(data['s_max']+data['s_min'])/2#计算平均薪资。data['s_min']=data['薪资'].str.extract('(\d+)')#取出最低薪资。
2024-07-10 20:48:29
1487
原创 stata有序逻辑回归
Logistic回归分析用于研究X对Y的影响,并且对X的数据类型没有要求,X可以为定类数据,也可以为定量数据,但要求Y必须为定类数据,如果Y有多个选项,并且各个选项之间可以对比大小,例如,1代表“不愿意”,2代表“无所谓”,3代表“愿意”,这3个选项具有对比意义,数值越高,代表样本的愿意程度越高,那么应该使用多元有序Logistic回归分析。案例:根据年龄、是否患有糖尿病,来分析哪些因素对BMI产生影响,而BMI分为正常、偏高、肥胖三类,为有序变量,因此采用的是有序逻辑回归。步骤:首先进行平行性检验。
2024-05-24 22:44:18
1093
原创 灰色关联分析
曲线越接近,相应序列之间的关联度就越大,反之就越小。这种方法的核心在于按照一定规则确立随时间变化的母序列,把各个评估对象随时间的变化作为子序列,求各个子序列与母序列的相关程度,依照相关性大小得出结论。分析序列(又称比较序列、子序列):影响系统行为的因素组成的数据序列,类似于因变量X,此处记为(x1,x2,…注意maxmax是求整个数列与参考数列的差值的最大值,反之求差值的最小值。(4)计算灰色关联度,灰色关联度越大,绩效越好,反之,绩效越差。关联度的排序是f4>f5>f7>f3>f6>f8>f1>f2。
2024-05-22 08:29:40
196
原创 爬取信用中国里面的行政处罚
result字段名为行政处罚文书号、处罚决定日期、处罚内容、处罚金额、违法事实、处罚机关、公司名称,行政处罚次数。file_path=r'E:\Data analyze\python\行政处罚爬虫/'#路径需要按实际修改。writer = pd.ExcelWriter('统计.xlsx')# 写入Excel文件。src_workbook=file_path+r'行政处罚(名单).xls' #表格名称也要更改。# keyword = input("输入爬取的公司全称必须是全称")
2024-05-21 15:54:26
508
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人