机器学习入门
GiggLee
这个作者很懒,什么都没留下…
展开
-
【笔记】使用Pandas进行评估和数据清理
由阿里云的《天池》下载的一些官方数据,并进行读取。文件名为《上海市》。输入以下代码:import pandasyimiao=pandas.read_csv(‘上海市.csv’)出现报错:OSError: Initializing from file failed可能由于中文字符的问题,于是引入open()函数:import pandasyimiao=pandas.read_csv(o...原创 2019-03-19 21:31:36 · 355 阅读 · 0 评论 -
使用k-近邻算法改进约会网站的配对效果
k-近邻(kNN),按我的理解就是无需进行数据训练,在样本测试的时候,由样本与k个训练值(邻居)的距离(本次使用欧式距离公式)来进行分类。本次将kNN作为第一种入门的算法进行学习并写下日志。缺点:对于维度很高的情况下可能会导致崩溃。(可以通过降温解决)数据来自《Machine Learning in Action》样本包含三种特征:1.每年获得的飞行常客里程数2.玩视频游戏所消耗时间百...原创 2019-03-20 18:46:07 · 382 阅读 · 0 评论 -
初学者来报道
通过学习了一段时间的python之后,准备在机器学习领域继续努力。在书籍的引导下,进行第一个机器学习样例的尝试,对机器学习的过程有了初步的了解。整个过程并不是很顺利的:首先是没有数据,于是自己编了个txt文件,并编了10组维度为2的数据(还没找到某个提供数据下载使用的平台)。然后是今天第一次使用anaconda中的spyder进行编码,由于txt文件内容没有编排好,还请小伙伴一块解决,最后...原创 2019-03-17 21:56:48 · 412 阅读 · 2 评论