HuntingGo的专栏

No man born great but the journey of a thousand miles begins with a single step

YUM软件管理

如上篇博文说的那样,RPM很方便,不过RPM也有它的不方便之处, 不重复开发轮子的开源开发的理念使得安装某个开源软件时候,总是需要手动的解决软件之间的依赖关系, 很多软件安装之前必须提前安装一个或者几个其他软件, 手工解决非常麻烦, 可以使用YUM来解决这个困难。 YUM 是一个RPM的前段程序,...

2014-02-04 21:28:47

阅读数 1225

评论数 0

RPM软件包管理

说RPM软件包管理前,先说一下源代码形式的管理 源代码形式的管理有以下几个特点: 1.绝大多数开源软件都是以源代码的形式公布 2.源代码一般会打包成tar.gz的归档压缩文件 3.源代码被编译成二进制后才可以运行 源代码的编译流程 1- ./configure  检查相关配置环境和相关库文件以及配...

2014-02-04 00:09:41

阅读数 1286

评论数 2

修改linux系统的root密码

由于linux下有6中运行级别 其中单用户运行几倍也就是 -1 运行级别为单用户运行级别 在该模式下可以修改root 密码 该模式有以下几个特点: 为内核传递参数 1  或者single 可以进入单用户模式‘ 单用户模式下不启动任何服务 单用户模式下默认是root 用户登录, 并且不需要密码 可以...

2014-01-31 22:50:51

阅读数 1367

评论数 0

ubuntu 启动长时间黑屏解决

自己的笔记本是thinkpad e425, 双显卡,装ubuntu一直卡在启动页面上,后来在bios中关闭了独显,所以成功将ubuntu装上 之后,开机时候直至显示用户登陆的页面时,屏幕都是黑屏,以下是解决方案: 1.安装 v86d 和 hwinfo,然后查看显卡支持的分辨率 sudo ap...

2016-02-27 20:11:18

阅读数 6842

评论数 1

Python cPickle模块

持久性就是指保持对象,甚至在多次执行同一程序之间也保持对象。通过本文,您会对 Python对象的各种持久性机制(从关系数据库到 Python 的 pickle以及其它机制)有一个总体认识。另外,还会让您更深一步地了解Python 的对象序列化能力。 什么是持久性? 持久性的基本思想很简单。...

2015-11-27 14:28:20

阅读数 415

评论数 0

通过身边小事解释机器学习是什么?

一个给不知道机器学习是什么东西的人讲的一个挺不错的例子,方法。 今天从 quora 上看了一个问题:如何给不是 CS 的学生,给不知道机器学习和数据挖掘的学生,讲明白什么是机器学习和数据挖掘。 其中有个答案很不错,拿买芒果的例子来给大家解释。老师们也应该多用用类似的一些例子,启发下...

2015-10-04 16:31:53

阅读数 527

评论数 0

nohup后台运行程序

无论是本地还是远程运行脚本,如果你想关闭控制台以后,脚本照样进行运行,那么就让脚本进行后台运行。 nohup这个命令可以使脚本后台运行。 比如我要运行  hello.py 那么在控制台输入  nohup python hello.py   这时候关闭控制台就可以了 那么怎么将后台运行的程序...

2015-09-11 17:22:40

阅读数 341

评论数 0

crontab 定时运行python程序遇到的一个错误

想在linux 下运行一个定时任务, 就写了几行代码测试一下,然后在crontab 也都配置好了, 但是发现程序就是运行不好。 下边为测试运行的小程序。 #!/usr/bin/env python # coding=utf-8 f = open('hehe', 'w') f.write('h...

2015-09-10 17:04:23

阅读数 786

评论数 0

协方差为什么能表示两个随机变量的相关性?

1.引言 作为machine learning的初学者,看到如此多的问题都能够用数学简单的进行解决,再次感觉到数学的魅力。数学不仅仅是枯燥的考试题,而是人类理解世界的一种重要的工具。所以同样在搞ml的筒子们,我认为搞好数学是关键。在machine learning中有时候要测评两个特征之间的联系的...

2015-08-12 20:48:58

阅读数 4661

评论数 1

腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?

腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中? 首先, 40亿个unsigned int 的整数,如果放到内存, 那就是大约16G的空间,那么直接放到内存空间进行排序然后二分查找的方式是行不通的,所以可...

2015-04-20 12:29:07

阅读数 5577

评论数 0

网页编码就是那点事

编码一直是让新手头疼的问题,特别是 GBK、GB2312、UTF-8 这三个比较常见的网页编码的区别,更是让许多新手晕头转向,怎么解释也解释不清楚。但是编码又是那么重要,特别在网页这一块。如果你打出来的不是乱码,而网页中出现了乱码,绝大部分原因就出在了编码上了。此外除了乱码之外,还会出现一些其他问...

2015-04-18 17:17:29

阅读数 570

评论数 0

Bloom Filter 布隆过滤器

布隆过滤器在很多场合能发挥很好的效果,比如:网页URL的去重,垃圾邮件的判别,集合重复元素的判别,查询加速(比如基于key-value的存储系统)等,下面举几个例子: 有两个URL集合A,B,每个集合中大约有1亿个URL,每个URL占64字节,有1G的内存,如何找出两个集合中重复的URL。 ...

2015-04-18 14:48:12

阅读数 921

评论数 0

从url获取域名 python

urllib来解析域名import urllib print "--"*40 for url in urls: proto, rest = urllib.splittype(url) res, rest = urllib.splithost(rest) ...

2015-01-16 11:48:52

阅读数 3036

评论数 0

外部python脚本调用django model

django 工程是运行在web server 下得。然而,通常需要开发一个外部的脚本与这个网页工程的model打交道。本文讲诉一个简单的方法去实现,可能不是最好的方法,但毕竟是一个方法。 看如下一个简单的例子。可以按照自己的需要去修改,如果你愿意的话。这个例子看起来有点故意做作,但确实能说明...

2015-01-14 21:25:44

阅读数 3557

评论数 1

关于mmseg分词算法的资料总结

http://www.byywee.com/page/M0/S602/602088.html 关于mmseg的简介 https://pypi.python.org/pypi/mmseg/1.3.0 关于mmseg python源码下载 https://pypi.python.org/py...

2015-01-13 16:41:59

阅读数 631

评论数 0

linux下berkeley-db及python binding安装

linux下berkeley-db及python binding安装 1, 下载源代码 shell > wget http://download.oracle.com/berkeley-db/db-5.3.21.tar.gz shell > wget http://pypi...

2015-01-10 20:27:14

阅读数 1716

评论数 0

网页去噪,获取网页正文相关开源项目

转载自:http://blog.csdn.net/cscmaker/article/details/8841198 (1)网页去噪          网页去噪需要去掉与网页内表达内容不相关的文字,如广告,评论等等。现在对于博客、新闻类的网页去噪已经有很多的应用,比如常用的印象笔记、有道...

2015-01-05 11:11:45

阅读数 733

评论数 0

Python中的生产者消费者问题

我们将使用Python线程来解决Python中的生产者—消费者问题。这个问题完全不像他们在学校中说的那么难。 如果你对生产者—消费者问题有了解,看这篇博客会更有意义。 为什么要关心生产者—消费者问题: 可以帮你更好地理解并发和不同概念的并发。信息队列中的实现中,一定程度上使用了生...

2015-01-03 11:30:36

阅读数 642

评论数 0

Understand Threads in python

We will see some examples of using threads in Python and how to avoid race conditions: You should run each example several times to notice that th...

2015-01-03 11:02:17

阅读数 583

评论数 0

网络爬虫技术

随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,百度,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎...

2014-07-27 00:10:56

阅读数 511

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭