![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 94
kevinQt
这个作者很懒,什么都没留下…
展开
-
【转载】有规模限制的聚类算法Python轮子
背景介绍机器学习的聚类算法在很多场景中都有应用,比如用户群体的聚类,地址聚类等。但是,在实际问题中,我们的聚类问题常常是有类的规模限制的,比如我们需要创建几个等大的类,或者有最小类大小的限制等。虽然在很多学习算法和初入机器学习的同学们看来,聚类相关算法是机器学习中无监督学习中常见的一种,但从另一个角度看,聚类其实是求解一个组合优化问题,属于NP-hard问题。应用场景员工/外卖员等任务分配:我们给员工分配具体的工作区域或者工作任务量。因为我们分配对象的任务是人,所以我们需要考虑人性,考虑任务原创 2021-08-19 19:26:32 · 773 阅读 · 0 评论 -
pandas的入门基础和框架使用
【因为近段时间在学习使用python进行数据分析,接触了pandas中的DataFrame,对这个DataFrame感觉很好,就顺带学习了以下其官方指导和基础知识。这里结合官方网页内容进行将要陈述,是对初次接触pandas的一个非常好的指导和说明。】DataFrame是进行数据分析的一个绕不过去的数据框架格式,这个数据框架我个人认为可以理解成为一种矩阵,并且是一种平面的二维结构矩阵。也就是说,可以...翻译 2018-05-20 08:22:19 · 1584 阅读 · 0 评论 -
基于Python的数据可视化工具pyecharts
本文属于转载,对原文进行了校对和微调,如有兴趣请参考原文。原文地址:https://blog.csdn.net/youzhouliu/article/details/78361503如何做Python 的数据可视化?pyecharts 是一个用于生成 Echarts 图表的类库。 Echarts 是百度开源的一个数据可视化 JS 库。主要用于数据可视化。一、安装pyecharts 兼容 Pytho...转载 2018-06-11 19:24:51 · 4319 阅读 · 1 评论 -
文本情感分析综述
这里转载一篇简单的综述,主题是关于 文本情感分析(坦白说,我觉得这篇所谓的原创其实也是转载的,中间转载的痕迹很明显,纯属个人观点)摘要:文本情感分析:又称意见挖掘、倾向性分析等。简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。互联网(如博客和论坛以及社会服务网络如大众点评)上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感...转载 2018-07-08 10:59:41 · 3118 阅读 · 0 评论 -
中文文本情感分析资料
可参考资料1)中文分词基本算法介绍2)ICTCLAS 汉语词性标注集3)文本分类技术4)文本分类与SVM5)基于贝叶斯算法的文本分类算法6)基于libsvm的中文文本分类原型7)LDA-math-文本建模8)情感分析资源9)面向情感分析的特征抽取技术研究9.1)斯坦福大学自然语言处理第七课-情感分析10)深度学习、自然语言处理和表征方法11)Deep Learning in NLP (一)词向量和...转载 2018-07-08 15:18:13 · 1058 阅读 · 0 评论 -
TF-IDF算法提取文章的关键词
初学中文文本分词,从最简单的TF-IDF算法入手,理解其中的逻辑结构,其中使用jieba分词包作为分词模型。这里部分内容参考了_hahaha的博客TF-IDF原理jieba分词提取关键词是按照词频(即每个词在文章中出现的次数)来提取的,比如要提取文章的前五个关键词,那么就是提取文章中出现次数最多的前五个词。而TF-IDF算法不仅统计每个词的词频,还为每个词加上权重。举个例子我们在大学选修了数学和体...原创 2018-07-08 16:14:58 · 3516 阅读 · 0 评论