自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 网易云评论进行LDA主题模型分析

LDA (Latent Dirichlet Allocation) 是一种无监督学习的主题模型,它可用来捕获文本中的主题结构。LDA 假设一个文档由多个主题组成,每个主题又由若干单词组成。在这个模型中,每个词都被赋予属于某个主题的概率,并由此推导出每个文档的主题分布以及每个主题的单词分布。LDA 主题模型可以用于很多自然语言处理的任务,如文本分类、信息提取、知识图谱构建、信息检索等。通过使用 LDA,我们可以挖掘大量文本中的潜在主题,从而帮助我们理解文本中的语义关系,抽取文本中的信息,并进一步应用于其他领域

2023-05-14 20:29:15 3296 2

原创 浅对boss直聘上广州的数据分析岗位发布情况进行分析

这样我们就把【薪资上限待清洗】里面的字母和文字清理干净了,然后我们就可以创建计算字段来处理薪资下限和上限的问题,由前面的数据我们知道,有些公司它的薪资是按每小时多少元发的有些则是按月发的,我们需要做的是把它们统一改为按月发多少K。接下来我们再把【薪资范围待清洗2】里面的薪资单位取出来,点击创建计算字段,把计算1改为“薪资单位”,然后在里面写RIGHT([薪资范围待清洗2],1),代码的意思是得到【薪资范围待清洗】右边的第一个字。然后再重新命名这两个字段,分别为【薪资范围待清洗2】和【发放频率】。

2023-04-12 23:27:24 1262 1

原创 【记搭建云端数据库过程】

这次的学习内容是跟B站的戴师兄学的,所以用到的资源可以到戴师兄的视频下面进行下载。写这个的目的主要是记学习的过程。下面就让我们看看怎么配置云端数据库吧。

2023-04-02 21:55:00 2448 10

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除