- 博客(5)
- 收藏
- 关注
原创 Python之《机器学习系统设计》第三章
聚类:寻找相关的帖子Levenshtein距离比Levenshtein距离更稳健的方法,叫做词袋法(bag of word),基于词频统计,记住出现次数。使用Scikit的CountVectorizer可以高效的完成词频的统计和向量化。from sklearn.feature_extraction.text import CountVectorizerimport osvect
2015-04-29 16:00:01 776 1
原创 Python之《机器学习系统设计》第二章
《机器学习系统设计》第二章:如何对真是样本分类采用IRIS数据集。数据集可以在http://archive.ics.uci.edu/ml/下载第一步是,可视化,这里选取第0个和第一个特征进行可视化import scipy as spimport numpy as npimport sklearn as slfrom matplotlib import pyplot as plt
2015-04-26 11:52:16 1168 3
原创 Python之《机器学习系统设计》第一章
第一步,先读取数据,并对数据进行清洗和展示## our first simple ML sampleimport scipy as spimport matplotlib.pyplot as plt# read datadata = sp.genfromtxt("data/web_traffic.tsv",delimiter="\t")print(data[:10]);print
2015-04-24 17:46:08 892
原创 Python之matplotlib
matplotlib是python的一个绘图库,命令与matlab很像。具体的用法可以参照 http://www.cnblogs.com/qianlifeng/archive/2012/02/13/2350086.htmlimport matplotlib.pyplot as pltplt.bar(left=0,height=1)plt.show()使用元组可以表示
2015-04-24 14:32:05 633
原创 Latex使用
Latex是一门写论文时用的语言,可以安装Ctex 环境,默认编辑器WinEdit字体太小,可以参考 http://blog.sina.com.cn/s/blog_6d0984870100n6tk.html 进行大小修改。 很多会议期刊都具有一些模版,比如\documentclass[conference]{IEEEtran}\begin{document}\title{My Ti
2015-04-23 11:13:02 1535
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人