- 博客(33)
- 资源 (14)
- 收藏
- 关注
原创 Python写的网络爬虫程序(很简单)
这是我的一位同学传给我的一个小的网页爬虫程序,觉得挺有意思的,和大家分享一下。不过有一点需要注意,要用python2.3,如果用python3.4会有些问题出现。
2014-11-27 21:07:08 2180
原创 Python中的 lamda表达式
lambda语句被用来创建新的函数对象,并且在运行时返回它们。python lambda是在python中使用lambda来创建匿名函数,而用def创建的方法是有名称的,除了从表面上的方法名不一样外,python lambda还有哪些和def不一样呢?1 python lambda会创建一个函数对象,但不会把这个函数对象赋给一个标识符,而def则会把函数对象赋值给一个变量。2 python lambda它只是一个表达式,而def则是一个语句。lambda表达式在“:”后只能有一个表达式。也就是说,在
2014-11-26 10:50:43 6006
原创 Linux gcc常用命令
GCC 的意思也只是 GNU C Compiler 而已。经过了这么多年的发展,GCC 已经不仅仅能支持 C 语言;它现在还支持 Ada 语言、C++ 语言、Java 语言、Objective C 语言、Pascal 语言、COBOL语言,以及支持函数式编程和逻辑编程的 Mercury 语言,等等。而 GCC 也不再单只是 GNU C 语言编译器的意思了,而是变成了 GNU Compiler Collection 也即是 GNU 编译器家族的意思了。另一方面,说到 GCC 对于操作系统平台及硬件平台支持,概
2014-11-25 22:04:53 983 1
原创 《深入理解计算机系统》关于csapp.h和csapp.c的编译问题
1.我的当前工作目录为/home/sxh2/clinux,目录下有3个文件inet_aton.c csapp.h csapp.c。2.编译csapp.c文件,命令为gcc -c csapp.c,生成目标文件csapp.o。3.编译inet_aton.c文件,命令为gcc -c inet_aton.c,生成目标文件inet_aton.o。4.链接目标文件csapp.o、inet_aton.o(由于csapp.c文件中有关于线程中部分,gcc编译的时候必须带 -lpthread,否则会出错的),命令为gc
2014-11-25 21:53:39 4358 1
原创 大端模式和小端模式的区别
在C语言中除了8位的char型之外,还有16位的short型,32位的long型(要看具体的编译器),对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。大端模式:字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中。小端模式:与大端存储模式相反,在小端存储模式中,低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节。
2014-11-25 18:57:55 19735 2
原创 Python os模块 常用功能小结
os 模块提供了一个统一的操作系统接口函数, 这些接口函数通常是平台指定的,os 模块能在不同操作系统平台如 nt 或 posix中的特定函数间自动切换,从而能实现跨平台操作
2014-11-25 12:20:12 3946
原创 Python的sys.stdout、sys.stdin重定向
sys.stdout 与 print当我们在 Python 中打印对象调用 print obj 时候,事实上是调用了 sys.stdout.write(obj+'\n')print 将你需要的内容打印到了控制台,然后追加了一个换行符print 会调用 sys.stdout 的 write 方法以下两行在事实上等价:sys.stdout.write('hello'+'\n') print 'hello'
2014-11-25 11:25:22 9467 1
原创 python读取文件小结
python读取文件小结你想通过python从文件中读取文本或数据。一.最方便的方法是一次性读取文件中的所有内容并放置到一个大字符串中:all_the_text = open('thefile.txt').read( ) # 文本文件中的所有文本 all_the_data = open('abinfile','rb').read( ) # 二进制文件中的所有数据
2014-11-24 21:48:42 1323
原创 Python3.4操作文件目录
编程语言对文件系统的操作是一项必不可少的功能,各种编程语言基本上都有对文件系统的操作,最简洁的莫过于linux里面shell的操作了,其次,则是python,ruby等动态语言的操作,那么,今天先来看下,在python里面如何使用一些常用的操作文件功能。
2014-11-24 21:45:18 2224 1
原创 Python3和以前版本的区别
Python3.0和以前版本的区别 (1)print 。3.1版本之后要用括号括起来(print("abs"),类似于java)而2.0版本不用。 (2)input代替了2.0版本的raw_input; (3)3.0版本没有file函数了,要打开文件要用open;f = open(shoplistfile,'wb'); (4)没有了Cpickle模块了,使用pickle模块; (5)使用pickle.dump()方法时,打开文件的读操作要是“wb”,使用load方法时
2014-11-24 19:59:14 1912
原创 Python对象引用和del删除引用
为了简化内存管理,Python通过引用计数机制实现自动垃圾回收功能,Python中的每个对象都有一个引用计数,用来计数该对象在不同场所分别被引用了多少次。每当引用一次Python对象,相应的引用计数就增1,每当消毁一次Python对象,则相应的引用就减1,只有当引用计数为零时,才真正从内存中删除Python对象。
2014-11-24 15:40:38 16351
原创 实词和虚词的区别(自然语言处理要用到)
关于实词和虚词的区别,在自然语言处理中会用到。实词是有实在意义的词,可以独立充当句子成分,一般可以单独回答问题。每一个实词都可以详细解说其词义。现代汉语实词一般名词、动词、形容词、数词、量词、代词六类。虚词是没有实在意义的词,一般不能单独充当句子成分(副词例外),不能单独回答问题(少数副词除外)。其存在的价值在于帮助构成句子的语法结构,表示某种语法关系。汉语的虚词主要有六种:副词、助词、连词、介词、叹词、拟声词。
2014-11-22 17:59:46 8352
原创 Python简明教程学习笔记
如果你想要指示某些不需要如转义符那样的特别处理的字符串(转义符号无效),那么你需要指定一个自然字符串。自然字符串通过给字符串加上前缀r或R来指定。例如 str=r"Newlines are indicated by \n"。print(str)结果为:Newlines are indicated by \n。一定要用自然字符串处理正则表达式。否则会需要使用很多的反斜杠。例如,后向引用符可以写成'\\1'或r'\1'。
2014-11-21 20:37:24 2038
原创 XML乱码问题和encoding的理解
文件编码也称为字符编码,用于指定在处理文本时如何表示字符。一种编码可能优于另一种编码主要取决于它能处理或不能处理哪些语言字符,不过通常首选的是 Unicode。读取或写入文件时,未正确匹配文件编码的情况可能会导致发生异常或产生不正确的结果。
2014-11-21 16:59:43 12152 3
原创 浏览器乱码问题的详细解决
浏览器乱码问题的详细解决,分析产生乱码原因:右击产生乱码的网页,然后点击“编码”,发现此时360浏览器编码为“中文(简体)GBK”,使用GBK解码utf-8编码的字符文件,当然会产生乱码。
2014-11-21 13:32:23 8317
原创 N-gram统计语言模型(总结)
自然语言从它产生开始,逐渐演变成一种上下文相关的信息表达和传递的方式,因此让计算机处理自然语言,一个基本的问题就是为自然语言这种上下文相关特性建立数学模型。这个数学模型就是自然语言处理中常说的统计语言模型,它是今天所有自然语言处理的基础,并且广泛应用与机器翻译、语音识别、印刷体和手写体识别、拼写纠错、汉字输入和文献查询。
2014-11-18 19:49:30 19991 2
原创 Linux Shell学习
Shell本身是一个用C语言编写的程序,它是用户使用Unix/Linux的桥梁,用户的大部分工作都是通过Shell完成的。Shell既是一种命令语言,又是一种程序设计语言。作为命令语言,它交互式地解释和执行用户输入的命令;作为程序设计语言,它定义了各种变量和参数,并提供了许多在高级语言中才具有的控制结构,包括循环和分支。
2014-11-17 23:24:17 989
原创 C++ 对象模型详细讲解(特别容易理解)
c++对象模型系列 转 一、指针与引用一 概括指针和引用,在C++的软件开发中非常常见,如果能恰当的使用它们能够极大的提 高整个软件的效率,但是很多的C++学习者对它们的各种使用情况并不是都了解,这就导致了实际的软件开发中经常会内存泄漏,异常抛出,程序崩溃等问题。对 于C和C++的初学者,那更是被它们搞的迷迷糊糊。本篇作为[深入C++]系列的第一节,我们就带领大家把
2014-11-16 21:06:11 4011
原创 新入职的程序员如何更快的融入项目当中
最近,我们项目中新入职的程序员比较多,于是我们花上了15分钟,就“新入职的程序员如何更快的融入项目当中?”这个问题进行了讨论。下面是讨论的结果总结,现在和大家分享一下,希望对新人或者项目管理者有一些有益的启发,则不枉我写这篇文章。1.解bug可以很快上手2.善于问问题,问周围同事3.看什么时候加入的:如果加入项目比较晚的话,一定要
2014-11-16 11:48:32 2444
原创 关键路径问题
拓扑排序主要是为了解决一个工程能否顺利进行的问题,但有时我们还需要解决工程完成所需要的最短时间问题。我们如果对一个流程图获得最短时间,就需要分析它们的拓扑关系,并且找到当中的最关键流程,这个流程的时间就是最短时间。
2014-11-14 15:59:21 5198
原创 拓扑排序问题
拓扑排序算法的基本思路:从AOV网中,选择一个入度为0的顶点输出,然后删除此顶点,并删除此顶点为弧尾的弧,继续重复此步骤,直到输出所有全部顶点或者AOV网中不存在入度为0(存在环)的顶点为止。
2014-11-13 23:36:51 2236
原创 XML(w3school)学习总结和摘要1
XML 文档形成一种树结构XML 文档必须包含根元素。该元素是所有其他元素的父元素。XML 文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。所有元素均可拥有子元素: ..... 父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。所有元素均可拥有文本内容和属性(
2014-11-13 00:30:09 1063
原创 数学之美(吴军著)学习总结和经典摘抄
翻译这件事之所以能达成,仅仅是因为不同的文字系统在记录信息的能力上是等价的。(这个结论很重要)进一步讲,文字只是信息的载体,而并非信息本身。
2014-11-09 22:48:58 3797
原创 C++ wchar_t介绍以及和string类型的转换
我们知道char类型变量可以存储一个字节的字符,它用来保存英文字符和标点符号是可以的,但是对于汉字、韩文以及日文这样的字符却不可以,因为汉字、韩文以及日文每一个文字都占据两个字节,为了解决这个问题,c++提出了wchar_t类型,称之为双字节类型,又称宽字符类型。
2014-11-08 12:28:34 7134
原创 C++求解汉字字符串的最长公共子序列 动态规划
最近,我在网上看了一些动态规划求字符串最长公共子序列的代码,但是无一例外都是处理英文字符串,当处理汉字字符串时,经常会出现乱码或者不正确的情况。 我对代码进行了修改,使用wchar_t类型存储字符串,能够正确的处理英文字符串和汉字字符串的最长公共子序列。代码如下:
2014-11-08 12:11:12 1871 2
原创 c++ setlocale函数的应用
setlocale配置地域化信息。语法: char * setlocale ( int category, const char * locale );返回值: 字符串函数种类: 操作系统与环境内容说明本函数用来配置地域的信息,设置当前程序使用的本地化信息。
2014-11-08 11:56:34 3796
原创 中文在C/C++中的处理和汉字乱码问题(wchar_t)
中文在C/C++中的处理和汉字乱码问题(wchar_t)如今编程的语言和编程环境随着中国的发展开始对中文有进一步的支持,但是对中文的支持总体来说是有缺陷的,而且有与编译环境的不同导致中文在当前的C/C++中有很多问题,而且很多版本对中文的支持是不完全的,就拿DEV-C++和VS2005为例,对与MSDN的帮助和网上的讲述两者在那些代码的支持有很多不同的地方。而我要讨论的就是对于中文在C/C++的应用方法。
2014-11-08 11:50:43 14979 6
原创 求两个字符串的最长的连续公共子串和求两个字符串的公共子序列
这与求两个字符串的公共子序列要区分开,见http://blog.csdn.net/shandianling/article/details/7888050但 求你方法与求公共子序列类似,而且要简单一点。方法:动态规划.循环遍历两个字符串,查找当s1[i]==s2[k] 的情况 然后保存在c[i][k]中,c[i][k]=c[i-1][k-1]+1 最后我们会得到类似以下矩阵
2014-11-08 11:33:37 1188
数据挖掘导论 清晰版
2014-05-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人