自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Liu Ruilun的博客

keep coding

  • 博客(9)
  • 收藏
  • 关注

原创 python机器学习——KNN算法简单入门(真的很简单!)

所有代码请移步GitHub——kNNbyPython很多人在第一次听到机器学习的时候都不知所措,无从下手。起初我也是这样的,各种看别人的博客,吴恩达的课程也死磕,但效果不佳。后来发现一个神奇的网站k-近邻算法实现手写数字识别系统–《机器学习实战 》,跟着过了一遍之后感觉还不错,也顺便买了《机器学习实战》这本书,接着就正式入坑机器学习。 KNN算法应该是机器学习中最简单的算法之一,作为机器学习...

2017-04-30 00:06:29 10881 4

原创 python构建指数平滑预测模型

指数平滑法其实我想说自己百度的… 只有懂的人才会找到这篇文章… 不懂的人…看了我的文章…还是不懂哈哈哈指数平滑法相比于移动平均法,它是一种特殊的加权平均方法。简单移动平均法用的是算术平均数,近期数据对预测值的影响比远期数据要大一些,而且越近的数据影响越大。指数平滑法正是考虑了这一点,并将其权值按指数递减的规律进行分配,越接近当前的数据,权重越大;反之,远离当前的数据,其权重越小。指数平滑法按照平

2017-04-14 16:31:29 21829 16

原创 python简单实战项目:《冰与火之歌1-5》角色关系图谱构建——数据库设计

在弄任何一个数据之前,肯定是要先设计数据库的。这里打算将《冰与火之歌》(以下称《冰火》)的文本数据先存入到数据库中,后续在使用python读取数据来处理。前期准备需要工具: 1.peewee 2.sqlite 3.python3.5(当然python2也是可以的)大致说一下: 1.peewee peewee是python中的一个轻量级ORM框架。 什么是ORM框架? ...

2017-04-10 16:38:13 5231 3

原创 python中正确安装对应版本的包

python在写机器学习的代码过程中,需要引入如numpy、matpoltlib、pandas等等等。有时候直接pip install+对应的包名并不能正确安装,或者安装后依旧会出现安装完全的情况。这里推荐一个基本包含了机器学习以及数据可视化功能的所有python包的下载网站Unofficial Windows Binaries for Python Extension Packages 里面的包

2017-04-10 11:31:55 32436 2

原创 python简单实战项目:《冰与火之歌1-5》角色关系图谱构建

前两天《权力的游戏》第七季发布了第二弹预告片,思索的第七季也快要来了,正想着脑子突然一热,要不弄个《权利的游戏》的角色共现图谱吧。故事里面的人物关系复杂程度也是出了名了的,如果能用python来把故事人物关系理一下,效果应该不错的。而且刚好之前也一直想弄个python的大数据简单实战项目,苦恼没有什么有意思的主题。这个预告片来得也巧。这里分三步走,一个是数据挖掘,一个是数据可视化实现。...

2017-04-09 15:26:02 7901 1

原创 python构建关键词共现矩阵

本文仅仅提供了实现思路,如果对算法速度有追求的请移步python构建关键词共现矩阵速度优化(在此非常感谢这位同学的优化) 非常感谢南京大学的张同学发现我代码中的bug,现文中的代码均已经更新请放心使用,并且代码放弃使用numpy进行矩阵的构建,因此可以对中文进行构建关键词共现矩阵了。同时,有很多同学对我在blog中总是提到的“import自己的代码“的代码感兴趣,现在已将代码git至GITHUB

2017-04-05 15:44:37 43104 44

原创 python实现机器学习中的各种距离计算及文本相似度算法

import numpy as npimport math# 依赖包numpy、python-Levenshtein、scipydef Euclidean(vec1, vec2): npvec1, npvec2 = np.array(vec1), np.array(vec2) return math.sqrt(((npvec1-npvec2)**2).sum())# eucli

2017-04-03 22:45:07 14194 1

原创 python3文本读取与写入常用代码

写入文本:import codecsdef write_txt(txt, path): f = codecs.open(path, 'a', 'utf8') f.write(str(txt)) f.close()# 传入参数为txt,path;txt为需要写入的内容,数据类型为字符串,path为写入的内容,数据类型为字符串。# 传入的path需如下定义:path= r

2017-04-02 15:45:35 11976 2

原创 python中import自己写的.py

python中import自己写的.py在使用python来处理数据时,经常需要使用到读取文本和写入文本的with open,如果将这两个语句写入一个.py文件中,那么每次需要读取或者写入文本时,只需要import就可以了。上代码:import codecs #防止编码报错#传入的参数为path和code,path表示txt文件的绝对或相对路径,code表示该txt的编码,一般为utf-8无bom

2017-04-02 15:15:41 46370 22

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除