自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

HuntingGo的专栏

No man born great but the journey of a thousand miles begins with a single step

  • 博客(103)

原创 YUM软件管理

如上篇博文说的那样,RPM很方便,不过RPM也有它的不方便之处, 不重复开发轮子的开源开发的理念使得安装某个开源软件时候,总是需要手动的解决软件之间的依赖关系, 很多软件安装之前必须提前安装一个或者几个其他软件, 手工解决非常麻烦, 可以使用YUM来解决这个困难。YUM是一个RPM的前段程序,其主要目的是为了自动解决RPM的自动依赖关系。他不像RPM一样, YUM不是一种新的软件封

2014-02-04 21:28:47 1286

原创 RPM软件包管理

说RPM软件包管理前,先说一下源代码形式的管理源代码形式的管理有以下几个特点:1.绝大多数开源软件都是以源代码的形式公布2.源代码一般会打包成tar.gz的归档压缩文件3.源代码被编译成二进制后才可以运行源代码的编译流程1- ./configure  检查相关配置环境和相关库文件以及配置参数形成makefile2- make  对源代码进行编译,形成二进制文件3-

2014-02-04 00:09:41 1340 2

原创 修改linux系统的root密码

由于linux下有6中运行级别其中单用户运行几倍也就是 -1 运行级别为单用户运行级别在该模式下可以修改root 密码该模式有以下几个特点:为内核传递参数 1  或者single 可以进入单用户模式‘单用户模式下不启动任何服务单用户模式下默认是root 用户登录, 并且不需要密码可以使用passwd修改root 密码流程如下:首先重启, 在选择Linux引导 时

2014-01-31 22:50:51 1452

原创 ubuntu 启动长时间黑屏解决

自己的笔记本是thinkpad e425, 双显卡,装ubuntu一直卡在启动页面上,后来在bios中关闭了独显,所以成功将ubuntu装上之后,开机时候直至显示用户登陆的页面时,屏幕都是黑屏,以下是解决方案:1.安装 v86d 和 hwinfo,然后查看显卡支持的分辨率sudo apt-get install v86d hwinfosudo hwinfo --framebuffe

2016-02-27 20:11:18 8487 1

转载 Python cPickle模块

持久性就是指保持对象,甚至在多次执行同一程序之间也保持对象。通过本文,您会对 Python对象的各种持久性机制(从关系数据库到 Python 的 pickle以及其它机制)有一个总体认识。另外,还会让您更深一步地了解Python 的对象序列化能力。什么是持久性?持久性的基本思想很简单。假定有一个 Python 程序,它可能是一个管理日常待办事项的程序,您希望在多次执行这个程序之间可以保

2015-11-27 14:28:20 512

转载 通过身边小事解释机器学习是什么?

一个给不知道机器学习是什么东西的人讲的一个挺不错的例子,方法。今天从 quora 上看了一个问题:如何给不是 CS 的学生,给不知道机器学习和数据挖掘的学生,讲明白什么是机器学习和数据挖掘。其中有个答案很不错,拿买芒果的例子来给大家解释。老师们也应该多用用类似的一些例子,启发下学生的思考。=============================买芒果有

2015-10-04 16:31:53 600

原创 nohup后台运行程序

无论是本地还是远程运行脚本,如果你想关闭控制台以后,脚本照样进行运行,那么就让脚本进行后台运行。nohup这个命令可以使脚本后台运行。比如我要运行  hello.py那么在控制台输入  nohup python hello.py   这时候关闭控制台就可以了那么怎么将后台运行的程序关掉呢只能通过ps -ef  找出正在运行程序的进程号,然后kill -9  进程号就可以了

2015-09-11 17:22:40 455

原创 crontab 定时运行python程序遇到的一个错误

想在linux 下运行一个定时任务, 就写了几行代码测试一下,然后在crontab 也都配置好了, 但是发现程序就是运行不好。下边为测试运行的小程序。#!/usr/bin/env python# coding=utf-8f = open('hehe', 'w')f.write('hello')f.close()如果程序运行的话, 会在程序目录中建一个名字为hehe的文件,但是没

2015-09-10 17:04:23 1058

原创 协方差为什么能表示两个随机变量的相关性?

1.引言作为machine learning的初学者,看到如此多的问题都能够用数学简单的进行解决,再次感觉到数学的魅力。数学不仅仅是枯燥的考试题,而是人类理解世界的一种重要的工具。所以同样在搞ml的筒子们,我认为搞好数学是关键。在machine learning中有时候要测评两个特征之间的联系的程度,举ml中一个简单的例子,现在要预测房子的价格,告诉了房子的面积X和花园的面积Y这两个特征,我们要测评一下X和Y之间的相关程度,即房子的面积和花园的面积是否有联系或者相关。那么这里就会用到了协方差,即Cov(X

2015-08-12 20:48:58 8868 3

原创 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?

腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?首先, 40亿个unsigned int 的整数,如果放到内存, 那就是大约16G的空间,那么直接放到内存空间进行排序然后二分查找的方式是行不通的,所以可以考虑如下的方式.1. 在这里可以考虑使用bitmap,需要4*10^9bit内存, 大约500M

2015-04-20 12:29:07 8619 4

原创 网页编码就是那点事

编码一直是让新手头疼的问题,特别是 GBK、GB2312、UTF-8 这三个比较常见的网页编码的区别,更是让许多新手晕头转向,怎么解释也解释不清楚。但是编码又是那么重要,特别在网页这一块。如果你打出来的不是乱码,而网页中出现了乱码,绝大部分原因就出在了编码上了。此外除了乱码之外,还会出现一些其他问题(例如:IE6 的 CSS 加载问题)等等。潜行者m 写出本文的目的,就是要彻底解释清楚这个编码问题

2015-04-18 17:17:29 618

原创 Bloom Filter 布隆过滤器

布隆过滤器在很多场合能发挥很好的效果,比如:网页URL的去重,垃圾邮件的判别,集合重复元素的判别,查询加速(比如基于key-value的存储系统)等,下面举几个例子:有两个URL集合A,B,每个集合中大约有1亿个URL,每个URL占64字节,有1G的内存,如何找出两个集合中重复的URL。很显然,直接利用Hash表会超出内存限制的范围。这里给出两种思路:      第一种:如果不允许

2015-04-18 14:48:12 982

原创 从url获取域名 python

urllib来解析域名import urllibprint "--"*40for url in urls: proto, rest = urllib.splittype(url) res, rest = urllib.splithost(rest) print "unkonw" if not res else res

2015-01-16 11:48:52 3439

转载 外部python脚本调用django model

django 工程是运行在web server 下得。然而,通常需要开发一个外部的脚本与这个网页工程的model打交道。本文讲诉一个简单的方法去实现,可能不是最好的方法,但毕竟是一个方法。看如下一个简单的例子。可以按照自己的需要去修改,如果你愿意的话。这个例子看起来有点故意做作,但确实能说明我要陈述的东西。假设你有一个自己的博客,用django 开发的。你想定期对老的数据进

2015-01-14 21:25:44 4370 1

原创 关于mmseg分词算法的资料总结

http://www.byywee.com/page/M0/S602/602088.html 关于mmseg的简介https://pypi.python.org/pypi/mmseg/1.3.0 关于mmseg python源码下载https://pypi.python.org/pypi/mmseg/1.3.0   关于mmseg python的简单实现

2015-01-13 16:41:59 708

原创 linux下berkeley-db及python binding安装

linux下berkeley-db及python binding安装1, 下载源代码shell > wget http://download.oracle.com/berkeley-db/db-5.3.21.tar.gzshell > wget http://pypi.python.org/packages/source/b/bsddb3/bsddb3-5.3.

2015-01-10 20:27:14 2024

转载 网页去噪,获取网页正文相关开源项目

转载自:http://blog.csdn.net/cscmaker/article/details/8841198(1)网页去噪         网页去噪需要去掉与网页内表达内容不相关的文字,如广告,评论等等。现在对于博客、新闻类的网页去噪已经有很多的应用,比如常用的印象笔记、有道笔记就用到了相关的技术。         因为项目的需要,也需要对网页进行去噪,留下有用的内容

2015-01-05 11:11:45 1010

转载 Python中的生产者消费者问题

我们将使用Python线程来解决Python中的生产者—消费者问题。这个问题完全不像他们在学校中说的那么难。如果你对生产者—消费者问题有了解,看这篇博客会更有意义。为什么要关心生产者—消费者问题:可以帮你更好地理解并发和不同概念的并发。信息队列中的实现中,一定程度上使用了生产者—消费者问题的概念,而你某些时候必然会用到消息队列。当我们在使用线程时,你可以学习以下的线

2015-01-03 11:30:36 743

转载 Understand Threads in python

We will see some examples of using threads in Python and how to avoid race conditions:You should run each example several times to notice that threads are unpredictable and that your results diffe

2015-01-03 11:02:17 636

转载 网络爬虫技术

随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,百度,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如: (1) 不同领域、不同背景的用户往往具有不同的检索目的和需求,通

2014-07-27 00:10:56 583

转载 Python实现mmseg分词算法和吐嘈

前两天一直在写爬虫,也是一直有心写个简单的搜索引擎吧,写出来肯定是没有Web界面的,本人不知道怎么地,对Web的代码一直有抵触心理。搜索引擎嘛,我想要写出来必须要懂五个部分:1、基础的多线程爬虫2、分词算法,对用户输入的查找文本进行切割3、MapReduce,用来统计词语出现的次数,这个直接关系到URL在队列中的等级4、PageRank,用来给网页排名5、Web界面上述

2014-07-26 23:59:23 1209

原创 android模拟器 出错:X Error of failed request: BadRequest (invalid request code or no such operation)

android模拟器 出错:X Error of failed request: BadRequest (invalid request code or no such operation)www.MyException.Cn   发布于:2014-07-18 01:40:33   浏览:0次 0android模拟器 报错:X Error of failed r

2014-07-22 23:19:57 1242

原创 20天的android学习

20多天的实习(其实是一个人学东西了)要结束了, 剩下的只有考研了, 这20多天学了不少的东西, 对android的开发也有了一定的了解,写此篇文章主要是考完研后可以快速的将学到的知识重新拾起1.一开始写安卓, 要对它的大体框架进行了解, 做到掌握大局2.开始入门阶段, 学习各个xml配置文件的作用, 学习基本要用到的View   了解常用的布局 :线性布局  相对布局3.了解

2014-07-18 11:39:09 1329 2

原创 ormlite 中的onUpgrade

public class DBHelper extends OrmLiteSqliteOpenHelper { public static final String DB_NAME = "yaotuo.db"; public static final int DB_VERSION = 4; //更新时候只需要修改这里就可以了 private static DBHelpe

2014-07-17 11:44:12 1806

转载 Android 使用com.j256.ormlite

概述          ORMlite是类似hibernate的对象映射框架,主要面向java语言,同时,是时下最流行的android面向数据库的的编程工具。官方网站:http://ormlite.com/ 如果需要开发android,只需要下载core和android两个jar包:ORMlite的使用1,建立映射关系

2014-07-15 09:27:35 1332

原创 python get post模拟请求

1.使用get方式时,url类似如下格式:[html] view plaincopyindex.jsp?id=100&op=bind  GET报问头如下:[html] view plaincopyGET /sn/index.php?sn=123&n=asa HTTP/1.1   Accept: */*

2014-07-14 17:43:36 1261

转载 XListView的介绍和使用

在开发的过程中,我们使一般会经常使用ListView,那么就会用到下拉刷新和上拉加载,我下载了XListView的框架,然后仔细分析了里面的原理,并且在原来的基础之上,增加了自己的想法,希望大家给出宝贵的建议,互相学习和探讨。  下载地址:http://download.csdn.net/detail/forwardyzk/7262781          下面先大概介绍一下开发思

2014-07-13 10:59:01 1389

原创 Django中的一些同步Model和数据库的命令

1最简单而又令人兴奋的命令: manage.py syncdb创建了指定app中的model对应的数据库表,如果是第一次使用此命令,会提示是否创建超级用户,输入用户名,Email和密码,接着可以看到在创建索引: 2. validate验证Model的正确性:manage.py validate,若Model全部有效,会提示:0 errors found.3.

2014-07-10 14:57:44 2057

原创 Android AsyncHttpClient

Android Asynchronous Http ClientA Callback-Based Http Client Library for Android  TweetDownloadversion 1.4.2 (latest)or fork me on githubOverviewAn asynchronous callbac

2014-07-09 11:01:05 1206

转载 利用convertView优化ListView性能

通过convertView  就避免了反复创建大量view的问题了 但是仍然有缺陷 当我们的ListView中填充的item有多种形式时 比如微博中 有的item中包含图片 有的item包含视频 那么必然的 我们需要用到2种item的布局方式此时如果只是单纯判断convert是否存在 会造成回收的view不符合你当前需要的布局 而类似转换失败出错退出这里要提到Ada

2014-07-09 10:12:17 550

转载 Android之Adapter用法总结 2

Android之Adapter用法总结1.概念        Adapter是连接后端数据和前端显示的适配器接口,是数据和UI(View)之间一个重要的纽带。在常见的View(List View,Grid View)等地方都需要用到Adapter。如下图直观的表达了Data、Adapter、View三者的关系:Android中所有的Adapter一览:

2014-07-09 08:36:12 510

原创 android adapter 1

SimpleAdapter参数说明:public SimpleAdapter (Context context, List> data, int resource, String[] from, int[] to)构造函数    参数    context   关联SimpleAdapter运行着的视图的上下文。    data        一个Map的列表。在列表中

2014-07-08 14:53:05 561

转载 Android特效 五种Toast详解

Toast是Android中用来显示显示信息的一种机制,和Dialog不一样的是,Toast是没有焦点的,而且Toast显示的时间有限,过一定的时间就会自动消失。1.默认效果:代码:Toast.makeText(getApplicationContext(), "默认Toast样式",     Toast.LENGTH_SHORT).show();2

2014-07-08 11:32:10 417

转载 android使用ListView和Adapter.getView Recycler的工作原理

正文始 项目用到ListView,由于要用到ImageView,图片源不是在资源里面的,没法使用资源ID,因此无法直接使用 SimpleAdapter,要自己写一个Adapter。在使用ListView和Adapter需要注意以下几点: 1. Adapter.getView() public View getView(int position, View conve

2014-07-08 11:11:25 698

转载 fastjson 介绍

简介Fastjson是一个Java语言编写的高性能功能完善的JSON库。高性能fastjson采用独创的算法,将parse的速度提升到极致,超过所有json库,包括曾经号称最快的jackson。并且还超越了google的二进制协议protocol buf。支持标准Fastjson完全支持http://json.org的标准,也是官方网站收录的参考实现之一

2014-07-05 17:01:26 736

原创 linux 下使用genymotion

在官网下载genymotion http://www.genymotion.cn/然后进行以下操作1.如果本机没有virtualbox 下载一个  可以通过指令 sudo apt-get install virtualbox-qt 进行下载2. 将下载的genymotion做以下操作chmod +x [INSTALLER_PATH]/genymotion-[VE

2014-07-01 16:13:14 3629

转载 安装Django环境(nginx+uwsgi + mysql)

1、安装Nginx服务器(此方法来自Nginx官网):sudo add-apt-repository ppa:nginx/stablesudo apt-get updatesudo apt-get install nginx2、安装Django框架(Django采用版本为1.4版本):wget http://www.djangoproject.c

2014-06-27 17:35:48 1085

转载 android 中的设计模式

一般来说,常用的设计模式有以下八种:单例、工厂、观察者、代理、命令、适配器、合成、访问者单例模式:目的是为了让系统中只有一个调用对象,缺点是单例使其他程序过分依赖它,而且不同单例运行在不同进程中,使得维护困难;工厂模式:生产固定的一些东西,如抽象类,缺点是产品修改麻烦;如喜欢动作片和爱情片的人分别向服务器发出同一个请求,就可以得到他们想看的影片集,相当于不同对象进行同一请求,需求均

2014-06-27 17:06:12 619

转载 android studio 快捷键

Alt+回车 导入包,自动修正Ctrl+N   查找类Ctrl+Shift+N 查找文件Ctrl+Alt+L  格式化代码Ctrl+Alt+O 优化导入的类和包Alt+Insert 生成代码(如get,set方法,构造函数等)Ctrl+E或者Alt+Shift+C  最近更改的代码Ctrl+R 替换文本Ctrl+F 查找文本Ctrl+Shift+Space 自动

2014-06-27 14:11:43 441

转载 C++编译器与链接器工作原理

这里并没不是讨论大学课程中所学的《编译原理》,只是写一些我自己对C++编译器及链接器的工作原理的理解和看法吧,以我的水平,还达不到讲解编译原理(这个很复杂,大学时几乎没学明白)。要明白的几个概念:    1、编译:编译器对源文件进行编译,就是把源文件中的文本形式存在的源代码翻译成机器语言形式的目标文件的过程,在这个过程中,编译器会进行一系列的语法检查。如果编译通过,就会把对应的CP

2014-06-25 10:57:34 600

空空如也

空空如也

空空如也
提示
确定要删除当前文章?
取消 删除