- 博客(9)
- 收藏
- 关注
原创 python机器学习——KNN算法简单入门(真的很简单!)
所有代码请移步GitHub——kNNbyPython很多人在第一次听到机器学习的时候都不知所措,无从下手。起初我也是这样的,各种看别人的博客,吴恩达的课程也死磕,但效果不佳。后来发现一个神奇的网站k-近邻算法实现手写数字识别系统–《机器学习实战 》,跟着过了一遍之后感觉还不错,也顺便买了《机器学习实战》这本书,接着就正式入坑机器学习。 KNN算法应该是机器学习中最简单的算法之一,作为机器学习...
2017-04-30 00:06:29 10881 4
原创 python构建指数平滑预测模型
指数平滑法其实我想说自己百度的… 只有懂的人才会找到这篇文章… 不懂的人…看了我的文章…还是不懂哈哈哈指数平滑法相比于移动平均法,它是一种特殊的加权平均方法。简单移动平均法用的是算术平均数,近期数据对预测值的影响比远期数据要大一些,而且越近的数据影响越大。指数平滑法正是考虑了这一点,并将其权值按指数递减的规律进行分配,越接近当前的数据,权重越大;反之,远离当前的数据,其权重越小。指数平滑法按照平
2017-04-14 16:31:29 21829 16
原创 python简单实战项目:《冰与火之歌1-5》角色关系图谱构建——数据库设计
在弄任何一个数据之前,肯定是要先设计数据库的。这里打算将《冰与火之歌》(以下称《冰火》)的文本数据先存入到数据库中,后续在使用python读取数据来处理。前期准备需要工具: 1.peewee 2.sqlite 3.python3.5(当然python2也是可以的)大致说一下: 1.peewee peewee是python中的一个轻量级ORM框架。 什么是ORM框架? ...
2017-04-10 16:38:13 5231 3
原创 python中正确安装对应版本的包
python在写机器学习的代码过程中,需要引入如numpy、matpoltlib、pandas等等等。有时候直接pip install+对应的包名并不能正确安装,或者安装后依旧会出现安装完全的情况。这里推荐一个基本包含了机器学习以及数据可视化功能的所有python包的下载网站Unofficial Windows Binaries for Python Extension Packages 里面的包
2017-04-10 11:31:55 32436 2
原创 python简单实战项目:《冰与火之歌1-5》角色关系图谱构建
前两天《权力的游戏》第七季发布了第二弹预告片,思索的第七季也快要来了,正想着脑子突然一热,要不弄个《权利的游戏》的角色共现图谱吧。故事里面的人物关系复杂程度也是出了名了的,如果能用python来把故事人物关系理一下,效果应该不错的。而且刚好之前也一直想弄个python的大数据简单实战项目,苦恼没有什么有意思的主题。这个预告片来得也巧。这里分三步走,一个是数据挖掘,一个是数据可视化实现。...
2017-04-09 15:26:02 7901 1
原创 python构建关键词共现矩阵
本文仅仅提供了实现思路,如果对算法速度有追求的请移步python构建关键词共现矩阵速度优化(在此非常感谢这位同学的优化) 非常感谢南京大学的张同学发现我代码中的bug,现文中的代码均已经更新请放心使用,并且代码放弃使用numpy进行矩阵的构建,因此可以对中文进行构建关键词共现矩阵了。同时,有很多同学对我在blog中总是提到的“import自己的代码“的代码感兴趣,现在已将代码git至GITHUB
2017-04-05 15:44:37 43104 44
原创 python实现机器学习中的各种距离计算及文本相似度算法
import numpy as npimport math# 依赖包numpy、python-Levenshtein、scipydef Euclidean(vec1, vec2): npvec1, npvec2 = np.array(vec1), np.array(vec2) return math.sqrt(((npvec1-npvec2)**2).sum())# eucli
2017-04-03 22:45:07 14194 1
原创 python3文本读取与写入常用代码
写入文本:import codecsdef write_txt(txt, path): f = codecs.open(path, 'a', 'utf8') f.write(str(txt)) f.close()# 传入参数为txt,path;txt为需要写入的内容,数据类型为字符串,path为写入的内容,数据类型为字符串。# 传入的path需如下定义:path= r
2017-04-02 15:45:35 11976 2
原创 python中import自己写的.py
python中import自己写的.py在使用python来处理数据时,经常需要使用到读取文本和写入文本的with open,如果将这两个语句写入一个.py文件中,那么每次需要读取或者写入文本时,只需要import就可以了。上代码:import codecs #防止编码报错#传入的参数为path和code,path表示txt文件的绝对或相对路径,code表示该txt的编码,一般为utf-8无bom
2017-04-02 15:15:41 46370 22
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人