![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
努力的敲码工
一个平平无奇的追梦者
展开
-
基于词云图的短信热词数据可视化
利用运营商的5000+条短信数据样本,提取样本短信文本中所对应的关键特征(高频词汇),频率由高到低,位置从中心到边缘,字体从大到小,笔画从粗到细,结合颜色修饰,达到突出重点的效果。核心思想:根据样本集中的文本包含的高频词汇作为输入(比如筛选出最高频的30个词),按频率的高低进行逐级突出显示。热词统计:短信、邮件、微信、QQ、微博、电商评价、新闻、各行业热词(旅游、世界杯、战争、考研等)、热点事件等场景。安装文本挖掘支持包、加载文本挖掘支持包。展示模型:给定多段文本,绘制出词云图。数据清理(去掉停用词)原创 2023-11-09 15:49:12 · 286 阅读 · 0 评论 -
用支持向量机SVM进行光学字符识别OCR
对数据进行拆分,按一定比例拆分为训练集和测试集(4:1)建模,采用线性核函数,查看模型结构。原创 2023-10-24 09:33:17 · 689 阅读 · 0 评论