1、目录 1、目录 2、前言 3、算法细节 1)企业信息数据准备 2)候选业务词袋 3)算法过程 4、算法改进 1)拓展数据源 2)有监督训练 2、前言 企业画像在企业推荐中是必不可少的一个环节,在客户初次查阅一个企业的信息时,企业画像(标签)可以直观的反应企业的主营业务。 3、算法细节 1)企业信息数据准备 爬取企业招聘信息,如下图所示: 分析招聘信息,我们可以整理出一个词典,包含了每个模块的标题,整理方法可以通过标题的格式、规则自动抽取后再做一部分人工筛选。 d_start = { u'岗位内容':1,u'岗位要求':1,u'岗位职责':1,u'职责':1,u'职责描述':1,