自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

相国大人

社交网络,社会计算,机器学习

  • 博客(13)
  • 资源 (7)
  • 收藏
  • 关注

原创 深入浅出EM算法

概率论基础你没见过的概率1约定2链式法则3贝叶斯定理4独立性5条件独立6随机变量独立性性质61对称62分解63弱联合64收缩65相交琴声不等式坐标上升方坐标下降法EM算法导出1 从最大似然估计MLE说起2 我们遇到了什么问题3 EM算法的导出4 最后一点小尾巴5 EM算法收敛性证明EM算法与高斯混合模型学习网友问题解答推荐资料

2017-02-14 13:45:55 6269 9

原创 关于奇异值以及奇异值分解SVD的思考

前言:   SVD作为一个很基本的算法,在很多机器学习算法中都有它的身影,特别是在现在的大数据时代,由于SVD可以实现并行化,因此更是大展身手。SVD的原理不难,只要有基本的线性代数知识就可以理解,实现也很简单因此值得仔细的研究。当然,SVD的缺点是分解出的矩阵解释性往往不强,有点黑盒子的味道,不过这不影响它的使用1,SVD的数学基础1.1为什么要做SVD分解?回顾特征值和特征向量  我们首先回

2017-02-13 18:33:09 10833

转载 用scikit-learn学习K-Means聚类

转载自:刘建平http://www.cnblogs.com/pinard/p/6169370.html 在K-Means聚类算法原理中,我们对K-Means的原理做了总结,本文我们就来讨论用scikit-learn来学习K-Means聚类。重点讲述如何选择合适的k值。1. K-Means类概述    在scikit-learn中,包括两个K-Means的算法,一

2017-02-12 10:08:17 12018

原创 K-Means聚类算法原理

转载自:刘建平:http://www.cnblogs.com/pinard/p/6164214.htmlK-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-M

2017-02-12 10:06:46 21888 3

转载 python线程、进程与协程

转载自:原文: https://liangxiansen.github.io/2016/08/08/python进程线程和协程/  作者: 梁先森Python线程python中threading模块用于提供线程相关的操作,线程是应用程序中工作的最小单元,擅长IO操作import threadingimport time# 创建一个任务def show(arg):

2017-02-12 09:18:41 1077

原创 Mysql解决The total number of locks exceeds the lock table size错误

InnoDB表执行大批量数据的更新,插入,删除操作时会出现这个问题,需要调整InnoDB全局的innodb_buffer_pool_size的值来解决这个问题,并且重启mysql服务。windows cmd:mysql -u root -p密码:root进入mysql命令show variables like "%_buffer%";(不要忘记带;号,没有;号表示一条语

2017-02-10 15:18:02 66088 2

原创 python 数据库去重操作

# -*- coding: UTF-8 -*-"""@version: python2.7.8@author: XiangguoSun@contact: sunxiangguodut@qq.com@file: connectdb.py@time: 2016/12/28 16:12"""import MySQLdbimport timedef connectdb():

2017-02-10 14:17:51 3564

原创 Python print函数重定向

pyton2.7版本:print filename >> exprpython3.5版本:print(expr,file=filename)

2017-02-09 14:49:37 1781

转载 MySQL数据库可以用任意ip连接访问的方法

通过CMD命令行修改数据库表的一个字段的值,实现连接,访问。第一步、找到MYSQL软件安装所在的bin目录;(1)cd\当前目录(2)指定MYSQL安装的bin目录(3)输入 -h localhost -u root -p;出现输入密码,此时输入你在安装MYSQL软件设置的密码即可。(4)输入 use mysql; sel

2017-02-09 14:46:28 1842

原创 python绘图小记

#!/usr/bin/env python# -*- coding: UTF-8 -*-"""@version: python2.7.8 @author: XiangguoSun@contact: sunxiangguodut@qq.com@file: 3.py@time: 2017/2/7 8:38@software: PyCharm"""import sysreload

2017-02-07 09:08:37 1386

转载 Python strip lstrip rstrip使用方法

转载自:http://www.cnblogs.com/pylemon/archive/2011/05/18/2050179.htmlPython中的strip用于去除字符串的首尾字符,同理,lstrip用于去除左边的字符,rstrip用于去除右边的字符。这三个函数都可传入一个参数,指定要去除的首尾字符。需要注意的是,传入的是一个字符数组,编译器去除两端所有相应的字符

2017-02-06 14:29:59 658

原创 python 中文文本分类

写这篇博文用了很多时间和精力,如果这篇博文对你有帮助,希望您可以打赏给博主相国大人。哪怕只捐1毛钱,也是一种心意。通过这样的方式,也可以培养整个行业的知识产权意识。我可以和您建立更多的联系,并且在相关领域提供给您更多的资料和技术支持。赏金将用于拉萨儿童图书公益募捐手机扫一扫,即可:目标读者:初级入门学生。本文假定,你对python已经有了最基本的掌握。如果你希望能够

2017-02-06 11:31:21 106108 205

原创 python核心模块之pickle和cPickle讲解

pickle模块使用的数据格式是python专用的,并且不同版本不向后兼容,同时也不能被其他语言识别。要和其他语言交互,可以使用内置的json包。cPickle是pickle的一个更快的C语言编译版本。pickle和cPickle相当于java的序列化和反序列化操作。常采用这样的方式使用:import cPickle as picklepickle.dump(obj,f

2017-02-05 18:36:28 10843

K近邻测试数据

K近邻测试数据

2017-03-28

中文文本停用词表

中文文本停用词表

2017-02-07

中文文本分类语料(复旦)-训练集

这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。

2017-02-06

复旦中文文本分类语料-训练集

由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。

2017-02-06

Timus_Beginner

Timus上习题解答与代码参考,这一部分对应于Timus上的Beginner部分的习题

2016-10-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除