sklearn
南楚巫妖
且试新茶
展开
-
NLP问题的日常碎碎念
NLP问题本3质其实就是数据为文本,预处理方式不同的机器学习问题。所以就我复现kaggle比赛的一些经验我可以这么写一点经验。1.预处理这个真的是重要中的重要,如果数据集不好,用什么方法效率都很低相对于英文的预处理,有着非常复杂的去数据的过程。中文感觉只需要一个jieba.stopword和corpus就行。在这里其实可以用pandas读取数据后,再积累一些堆积的方法,然后一次性给它割的干干净净,这样十分光滑,减少痛苦。2.模型搭建。我见过两种模型1.使用pipeLine将特原创 2020-05-31 12:16:26 · 352 阅读 · 0 评论 -
文本分类的10种算法代码实现
这是文本分类的常见10种机器学习算法的实现:这是常见的代码:https://github.com/yingdajun/-12-原创 2020-04-11 19:11:32 · 1842 阅读 · 0 评论 -
混合编程和机器学习的融合
为了提高自己对机器学习能力和混合编程能力。作为一个小菜鸡,我又要开始水博客了。今天我写了一个项目框架。基于NLP和ML的混合编程。用C#为界面,调用相应的功能。鉴于混合编程技术我掌握不太熟练。调用打包的EXE不但程序大且运转起来也贼慢所以这个还只是一个小雏形。期望以后我能将它完善了,不但是功能还有控件。点击计算精度后:选择算法:选择搜索以后:选择关键词提...原创 2020-02-28 16:36:00 · 290 阅读 · 0 评论 -
sklearn 第三方库包的 评估精度那个类的常见功能实现
这是我写的相关github代码,可以拿去用一波https://github.com/yingdajun/Sklearn-原创 2019-12-04 22:35:17 · 238 阅读 · 0 评论