Machine Learning
misterbobo
这个作者很懒,什么都没留下…
展开
-
Python下切分文本的一些常用规则
在撸《机器学习实战》这本书的时候, 在“基于概率论的分类方法:朴素贝叶斯”这一个章节中发现了作者在谈到切分文本的一些处理原则,记下来可以作为一些初学者的文本处理参考。本文的实现的方式均为Python对于一个文本字符串,可以用string.split( )方法进行切分:>>> mySent = 'This book is the best on Python or M.L. I have ever转载 2018-01-28 16:44:40 · 3673 阅读 · 0 评论 -
数据缺失值的处理方法
数据的准备往往占到整个工作的70%的时间。数据准备包括了数据的抽取,清洗,转换,集成。这里简单介绍一下数据缺失值处理的一般方法。数据缺失值处理主要分成三个大类1.删除;2.补齐;3.忽略。删除数据将存在遗漏信息属性值的数据删除,得到一个完整的数据组。优点:简单易行,在数据含有多个属性缺失值、被删除的含缺失值的数据与信息表中的数据量相比非常小的情况下是非常有效的 缺点:...转载 2018-03-03 15:24:45 · 19606 阅读 · 0 评论 -
推荐系统中的冷启动问题
转载:https://www.jianshu.com/p/97e46f933010冷启动问题的定义推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,对于BAT这类大公司来说,它们已经积累了大量的用户数据,不发愁。但是对于很多做纯粹推荐系统的网站或者很多在开始阶段就希望有个性化推荐应用的网站来说,如何在对用户一无所知(即没有用户行为数据)的情况下进行最有效的推荐呢?这就衍生了冷启动问题。冷转载 2018-03-04 10:50:58 · 11870 阅读 · 0 评论