自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Row Row Row your boat

自在而为

  • 博客(5)
  • 收藏
  • 关注

原创 Python之《机器学习系统设计》第三章

聚类:寻找相关的帖子Levenshtein距离比Levenshtein距离更稳健的方法,叫做词袋法(bag of word),基于词频统计,记住出现次数。使用Scikit的CountVectorizer可以高效的完成词频的统计和向量化。from sklearn.feature_extraction.text import CountVectorizerimport osvect

2015-04-29 16:00:01 776 1

原创 Python之《机器学习系统设计》第二章

《机器学习系统设计》第二章:如何对真是样本分类采用IRIS数据集。数据集可以在http://archive.ics.uci.edu/ml/下载第一步是,可视化,这里选取第0个和第一个特征进行可视化import scipy as spimport numpy as npimport sklearn as slfrom matplotlib import pyplot as plt

2015-04-26 11:52:16 1168 3

原创 Python之《机器学习系统设计》第一章

第一步,先读取数据,并对数据进行清洗和展示## our first simple ML sampleimport scipy as spimport matplotlib.pyplot as plt# read datadata = sp.genfromtxt("data/web_traffic.tsv",delimiter="\t")print(data[:10]);print

2015-04-24 17:46:08 892

原创 Python之matplotlib

matplotlib是python的一个绘图库,命令与matlab很像。具体的用法可以参照 http://www.cnblogs.com/qianlifeng/archive/2012/02/13/2350086.htmlimport matplotlib.pyplot as pltplt.bar(left=0,height=1)plt.show()使用元组可以表示

2015-04-24 14:32:05 633

原创 Latex使用

Latex是一门写论文时用的语言,可以安装Ctex 环境,默认编辑器WinEdit字体太小,可以参考 http://blog.sina.com.cn/s/blog_6d0984870100n6tk.html 进行大小修改。   很多会议期刊都具有一些模版,比如\documentclass[conference]{IEEEtran}\begin{document}\title{My Ti

2015-04-23 11:13:02 1532

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除