自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 实现LDA 主题模型分析|商品评论

LDA主题分析是一种从商品评论中自动提取核心话题的技术。它能识别用户关注的主要维度(如续航、价格等),通过关键词权重和主题占比量化用户需求,帮助商家快速定位产品优缺点、竞品差异和运营方向。分析流程包括数据清洗、分词、模型训练和可视化展示,最终生成结构化报告指导商业决策。该方法可节省人工分析成本,精准把握用户诉求,适用于产品优化和营销策略制定。

2025-09-04 09:00:00 339

原创 优化 | 结合关键词定向抓取BOSS直聘全国岗位信息

获取的岗位数量非0的URL的占比越高,对比旧版写入效率提升就越明显,例如参数配置为 全国373个地级市/县/区(区域选择全选)、关键词为‘大数据’、其余参数均为‘不限’,那么URL数量 = 373 × 1(求职类型) × 1(薪资待遇) × 10(页码)= 3730众所周知,大数据相关岗位的数量只有在较发达的城市才较可观,所以会有不少的URL获取的数据为0,但好在占比不是太极端,在这样的情况下测试显示普通版平均每分钟有效写入17.28条,并发版则是29.85条,效率提高。

2025-09-03 15:37:17 643

原创 MOOC高校课程数据获取 | 应用分享

中国大学 MOOC 作为国内优质在线教育核心平台,目前已上线超 6 万门课程、覆盖 13 个学科门类、服务上亿学习者,其数据具备显著分析意义,可聚焦四大方向展开:1.:通过平均评分、五星占比、评论关键词(如 “老师讲的特别清晰”),对比不同学科(艺术学、理学)、高校课程的受欢迎度与质量差异;2.:结合开课时间、学时、频次,梳理高校在线课程的更新节奏、教学周期及学科开设密度;3.:依托高校 ID、讲师职称、课程分类,观察优质资源在高校与学科间的分布,以及讲师结构与授课类型的匹配度;4.

2025-09-01 16:47:26 861

原创 结合关键词定向获取BOSS全国岗位信息 | 应用分享

1.启动机器人程序,根据弹窗提示依次填写必要参数,总共需要配置两次不同信息(间隔10s左右),第一次是存储文件路径配置,第二次是参数配置,对了,推荐勾选【记住内容】。2.点击插件图标打开设置面板:选择「随机间隔」,时间范围设置为 25-30 秒,点击「开始刷新」,确认页面会按设定间隔自动刷新。区/县/地级市,选择前者自动覆盖所属下级县/区地级市,例如选择浙江,那么浙江下属的。安徽】,求职类型选择了【全职;那么,所有区域选择的下属地级市/区的数量的和 = 11(浙江)+16(安徽)= 27。

2025-09-01 16:30:04 929 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除