自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 魔道祖师小说jieba分词

要分词的文章分完词的结果词云图词频前十直方图停用词在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。添加自定义词典为了解决新词问题,jieba分词基于HMM算法会自动识别新词,我们这里直接给出新词表(dict2.txt),提高准确率。jieba.load_userdict('文件路径/魔道祖师分.

2021-04-25 22:27:51 793 2

原创 航空公司用户价值分析

前言面对激烈的市场竞争,各个航空公司都推出了更优惠的营销方式来吸引更多的客户,国内某航空公司面临着常旅客流失、竞争力下降和航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略,对不同的客户群提供个性化的客户服务是必须的和有效的。一、介绍这里识别客户价值使用的是三个指标:R F M 简称RFM模型最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary)这里我们将L(客户

2021-04-25 21:21:00 698 1

原创 python机器学习之爬取拉勾网上与python相关的工作信息

目录1.实验过程1.1数据爬取1.1.1分析爬取的网页结构2.1.3程序运行结果如图:2.1.4爬取到的职位信息:2.2数据处理2.2.1数据清洗代码:2.2.2程序运行结果如图:2.3数据可视化2.3.1绘制各城市平均月薪直方图2.3.1.1绘制直方图代码:2.3.1.2程序运行结果如图:2.3.2绘制与python相关工作主要分布的城市饼图2.3.2.1绘制饼图代码:2.3.2.2程序运行结果如图:2.3.3绘制公司福利的词云图2.3.3.1绘制词云图代码:2.3.3.2程序运行结果如图:3.实验结果4

2021-04-10 20:56:21 387 4

原创 网络爬虫与机器学习算法在城市分析中的应用(python)

第一章 Python 机器学习之网络爬虫与机器学习算法在城市分析中的应用文章目录前言一、成都美食数据分析1.1美食数据获取1.1.1爬虫过程1.2美食数据处理1.3 美食数据可视化1.3.1 店铺名称词云图1.3.2美食种类占比图1.3.3地区餐厅直方图1.3.4地区人均价格折线图1.3.5 成都美食据集地图二、成都租房数据分析2.1租房数据获取2.2 租房数据预处理2.2.1 缺失值处理2.2.2 数据格式规范化2.2.3数据集的划分2.2.4数据归一化2.3 预测租房价格模型构造2.3.1 多元线

2021-04-10 20:38:08 1807 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除