自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 python爬取58同城的新房信息

python爬取58同城中长沙的新房信息

2024-07-10 21:14:05 206

原创 BOSS招聘中数据分析岗位分析

data=data[data['职位'].str.contains('数据分析',na=True)&~data['职位'].str.contains('兼职',na=True)&~data['职位'].str.contains('实习',na=True)]#筛选数据分析且不包含兼职的岗位。data['s_mean']=(data['s_max']+data['s_min'])/2#计算平均薪资。data['s_min']=data['薪资'].str.extract('(\d+)')#取出最低薪资。

2024-07-10 20:48:29 1487

原创 爬取boss直聘数据分析岗位招聘信息

poss爬取boss中某城市的数据分析岗位的招聘信息

2024-07-04 11:24:53 338

原创 stata有序逻辑回归

Logistic回归分析用于研究X对Y的影响,并且对X的数据类型没有要求,X可以为定类数据,也可以为定量数据,但要求Y必须为定类数据,如果Y有多个选项,并且各个选项之间可以对比大小,例如,1代表“不愿意”,2代表“无所谓”,3代表“愿意”,这3个选项具有对比意义,数值越高,代表样本的愿意程度越高,那么应该使用多元有序Logistic回归分析。案例:根据年龄、是否患有糖尿病,来分析哪些因素对BMI产生影响,而BMI分为正常、偏高、肥胖三类,为有序变量,因此采用的是有序逻辑回归。步骤:首先进行平行性检验。

2024-05-24 22:44:18 1093

原创 灰色关联分析

曲线越接近,相应序列之间的关联度就越大,反之就越小。这种方法的核心在于按照一定规则确立随时间变化的母序列,把各个评估对象随时间的变化作为子序列,求各个子序列与母序列的相关程度,依照相关性大小得出结论。分析序列(又称比较序列、子序列):影响系统行为的因素组成的数据序列,类似于因变量X,此处记为(x1,x2,…注意maxmax是求整个数列与参考数列的差值的最大值,反之求差值的最小值。(4)计算灰色关联度,灰色关联度越大,绩效越好,反之,绩效越差。关联度的排序是f4>f5>f7>f3>f6>f8>f1>f2。

2024-05-22 08:29:40 196

原创 爬取信用中国里面的行政处罚

result字段名为行政处罚文书号、处罚决定日期、处罚内容、处罚金额、违法事实、处罚机关、公司名称,行政处罚次数。file_path=r'E:\Data analyze\python\行政处罚爬虫/'#路径需要按实际修改。writer = pd.ExcelWriter('统计.xlsx')# 写入Excel文件。src_workbook=file_path+r'行政处罚(名单).xls' #表格名称也要更改。# keyword = input("输入爬取的公司全称必须是全称")

2024-05-21 15:54:26 508

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除