- 博客(66)
- 收藏
- 关注
转载 dns
什么是公用dns?对于广大网民而言,头疼的问题之一就是宽带服务商强行劫持DNS,随之而来的就是满屏乱飞的广告,简直就是挥之不去的恶梦。本人一普通的不能再普通的网民一份子,自然也深受其苦,投诉无门之下,无奈,只有使用公用DNS服务器,杜绝国内宽带服务商的流氓行径。目前,较权威的公用DNS服务器提供商有OpenDNS,Google Public DNS,Norton DNS ,那么这几个D
2016-08-31 01:19:33 2837
转载 yum信息
查看关于yum的配置ls /etc/yum* -ld:查看/etc/yum.repos.d下的文件查看CentOS-Base.repo内容:部分内容:[base]baseurl=http://mirror.centos.org/centos/$releasever/os/$basearch/mirrorlist=http://mirrorlist.cen
2016-08-30 21:46:22 224
原创 手动安装tcpdump
wget http://www.tcpdump.org/release/tcpdump-4.5.1.tar.gzwget http://www.tcpdump.org/release/libpcap-1.5.3.tar.gz从官网下载的tcpdump-4.6.2.tar. gz 它是个源码包,需要你自己编译一下子的。具体操作如下:1安装c编译所需包:apt-get install
2016-08-30 20:03:50 3094
转载 configure-make-make install
这些都是典型的使用GNU的AUTOCONF和AUTOMAKE产生的程序的安装步骤。./configure是用来检测你的安装平台的目标特征的。比如它会检测你是不是有CC或GCC,并不是需要CC或GCC,它是个shell脚本。make是用来编译的,它从Makefile中读取指令,然后编译。make install是用来安装的,它也从Makefile中读取指令,安装到指定的位置。
2016-08-30 20:00:10 252
原创 yum源配置
今天为了给服务器配置firefox,花了好长时间看yum源配置的问题。虽然是看懂了,但是,好像服务器屏蔽了或者怎么了,所有的源包括163,sjtu,centos的全都网络不可达,白花了这么多时间。centos系统中与yum有关的配置文件一个是/etc/yum.conf 还有一个是/etc/yum.repo.d/Centos-Base.repo其中第二个里面的内容很好看懂
2016-08-29 22:36:32 487
原创 重点:货车帮
货车帮是货车方,物流qq是货主方。岗位有:Java开发工程师北京/成都2016/06/08产品经理成都2016/06/08高级运维工程师成都2016/06/08高级/中级 大数据工程师成都2016/06/08大数据架构师北京2016/06/08高级/中级 大数据平台工程师成都2016/06/08高级Android开发工程师成都
2016-08-29 14:11:22 1272
原创 python doc
看到一个东西,不能更炫:就是如何查看python下安装的各种工具的API。1.在命令行里:python -m pydoc -p 4567然后回到网页中键入网址:localhost:4567就可以了,进入工具列表,可以选择自己需要的工具查看API
2016-08-29 13:01:01 510
原创 git理解
今天又用了下git,往github上传了些资料。首先建立仓库,git init,位置必须在你要git push 的那些文件同一级或者下一级目录里。git add -A 要添加的文件或者目录。git status(查看当前的缓存中有哪些文件)git commit -m "注释信息,解释该版本"git status建立git仓库后,在.git中有个config配置文件,这里
2016-08-28 21:45:50 341
原创 python读取文件写入数据库中编码问题
在把sina数据保存到数据库的过程中又碰到了些新问题。文本如下:# coding=utf-8import MySQLdb import codecs#读取爬取到的文件,按照用户名判断是否在数据库中存在,并返回idinfofile = codecs.open("inforead.txt", 'r', 'utf-8')infofilenew = codecs.open("info
2016-08-28 14:24:05 1881
原创 UnicodeEncodeError: 'latin-1' codec can't encode character
问题:What could be causing this error when I try to insert a foreign character into the database?>>UnicodeEncodeError: 'latin-1' codec can't encode character u'\u201c' in position 0: ordinal not i
2016-08-27 14:49:05 2917
原创 mysql字符集(character set)
搞了一上午终于算是搞定了数据库的字符集问题了。数据库的字符集从我刚开始接触IT时候就是个问题,但当时没有搞明白,而且对计算机很多原理,上网搜集资料都能力不足。今天又碰到了这个问题,好好考虑了下,然后还在边搜集资料边思考问题,这是一大改进。通常网上的数据,编译器里的数据或者输出的数据都是utf8形式的。而数据库可以用show create database dbname查看,可以看到有很多地方涉
2016-08-27 13:59:14 8227
转载 mysql字符集介绍
1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。上个世纪60年代,美国制定了一套字符编码,对英语字符与二
2016-08-27 10:18:16 391
转载 'latin-1' codec can't encode character 的解决方案
分析一个字符串,并更新数据库的时候,出现了如下错误:'latin-1' codec can't encode character u'\u017e' in position 11: ordinal not in range(256)进行了一些研究发现,原因是,数据库的编码和数据源的编码不一致,并且包含了不能处理的字符。有两种方法可用,一个是先预先处理一下字符串,二是设置数据库参
2016-08-27 09:27:46 42697 1
转载 java自动装箱与拆箱
这个是jdk1.5以后才引入的新的内容,作为秉承发表是最好的记忆,毅然决定还是用一篇博客来代替我的记忆:java语言规范中说道:在许多情况下包装与解包装是由编译器自行完成的(在这种情况下包装成为装箱,解包装称为拆箱);其实按照我自己的理解自动装箱就可以简单的理解为将基本数据类型封装为对象类型,来符合java的面向对象;例如用int来举例://声明一个Integer对象In
2016-08-27 00:57:05 390
转载 UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)
没有验证对不对,看着挺有道理的样子,先转发。在使用selenium处理中文网页或者网页标题是中文的时候,出现UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128),1 from selenium import webdriver2
2016-08-26 22:30:59 2559
原创 数据库中数据表某字段无法写
今天碰到特别诡异的一个问题,就是opensns_weibo中的from字段无法写。想了好多方法,都不行,后来想到可能是和from这个关键字有关系,查资料,偶然发现加上`就可以了。然后我试试‘发现还是不行,不够仔细阿,其实不是这个符号’,而是这个符号`。以前从来没有发现过这个符号的用处,今天算是长见识了。`这个符号是esc下面的那个。。。。
2016-08-26 22:23:19 531
转载 python操作数据库mysql
1. 要想使Python可以操作MySQL数据库,首先需要安装MySQL-python包,在CentOS上可以使用一下命令来安装[python] view plain copy $ sudo yum install MySQL-python 2. 啥都不说了,走两步吧,下面的程序创建了一个到mysql数据库的连接,然后执行了一个简单的查询,并打印查询结果
2016-08-26 16:54:31 457
转载 封装
总结之前的内容,对象(object)指代某一事物,类(class)指代象的类型。对象可以有状态和动作,即数据成员和方法。到现在为止,数据成员和方法都是同时开放给内部和外部的。在对象内部,我们利用this来调用对象的数据成员和方法。在对象外部,比如当我们在另一个类中调用对象的时,可以使用对象.数据成员 和 对象.方法() 来调用对象的数据成员和方法。我们将要封装(encapsulatio
2016-08-26 01:23:52 239
转载 stackoverflow重要性
作为一名程序员,如果没有听过 Stackoverflow,那么你最好去面壁思过一下。程序员最需要阅读的一本编程书籍(其实编程书留下这本就够了!): (主页君强势插入,上图是一张恶搞图,之前有网友没看懂这张,特别说一下) 那些还没有读过这本书的程序员,是时候买一本了。如果还在犹豫,那么先看下这篇文章,看看为什么离不开 stackoverflow。 提问的智慧 当
2016-08-25 22:40:15 4690
转载 Python爬虫和情感分析简介(现在基本都用深度学习做情感分析了)
摘要 这篇短文的目的是分享我这几天里从头开始学习Python爬虫技术的经验,并展示对爬取的文本进行情感分析(文本分类)的一些挖掘结果。 不同于其他专注爬虫技术的介绍,这里首先阐述爬取网络数据动机,接着以豆瓣影评为例介绍文本数据的爬取,最后使用文本分类的技术以一种机器学习的方式进行情感分析。由于内容覆盖面巨大,无法详细道尽,这篇文章旨在给那些对相关领域只有少量或者没有接触的人一个认知的窗口,希
2016-08-25 22:27:10 5296 2
转载 [python爬虫] Selenium爬取新浪微博内容及用户信息
感谢原作者在进行自然语言处理、文本分类聚类、推荐系统、舆情分析等研究中,通常需要使用新浪微博的数据作为语料,这篇文章主要介绍如果使用Python和Selenium爬取自定义新浪微博语料。因为网上完整的语料比较少,而使用Selenium方法有点简单、速度也比较慢,但方法可行,同时能够输入验证码。希望文章对你有所帮助~源码下载地址:http://download.csdn.net/deta
2016-08-25 19:16:09 7220 5
原创 继续爬xinlang
最开始用的webmagic,后来看scrapy方便实用就用scrapy了 ,后来碰到个编码问题,具体说下。1.爬取时新浪不让爬,然后每次重定向到robot.txt的一个路径。后来索性就爬取整个网页,但是爬取了以后发现里面很多utf8编码,没找到解编码的方法,因为爬取的整个网页中有些部分是汉字可以显示的,有些做了jsp处理的就不能显示汉字了。网上搜的时候发现了一个新东西娇selenium,说是爬
2016-08-25 19:14:42 513
原创 蓄水池算法
问题起源于编程珠玑Column 12中的题目10,其描述如下: How could you select one of n objects at random, where you see the objects sequentially but you do not know the value of n beforehand? For concreteness, how woul
2016-08-24 15:22:00 339
原创 something
1.当初考研复试的时候来到研究生学校即是机缘巧合,也是必然;碰壁很多,收获很多。2.现在面试并没完全摆脱当初的困境,还需要继续争取。3.简单说说华为的过程吧:刚开始谈了下这个学校,我们学生的类别问题。华为总归是好点,不像之前LTB说的网易的HR不太知道这个学校。然后看着我的简历谈了下opensns,然后他说这里面没什么(这点说明我描述的不清楚,可能他以为我没做什么实质性质的东西),
2016-08-24 15:10:07 250
原创 闯迷宫问题
题目:长宽高为ABC的三维立方体,其中每个小立方体的状态为可行,不可行两种状态。起始点为(0,0,0),终点为(a-1,b-1,c-1),时间t:如果在时间T内可以走到终点,则胜利,反之,如果在时间T内不可到达终点,或者无法到达终点,则失败。输入:第一行为k(测试样例数)第二行ABCT第三行到结束为立方体的每个格的状态,为1说明不可走,为0说明可通。代码总是说RTL,本地运行做了部
2016-08-22 08:51:57 295
原创 new scanner(system.in)超时问题
当new scanner(system.in)超时的时候,我们可以改为Scanner scanner = new Scanner(new BufferedInputStream(System.in));
2016-08-21 23:03:40 2292 5
原创 快排
快排是分治思路,一趟排序的具体做法是:附设两个指针low和high,它们的初始位置分别为low和high,设枢轴记录的关键字为pivotkey,则首先从high所指的位置起向前搜索找到第一个关键字小于pivotkey的记录和枢轴记录互换,然后从low所指位置起向后搜索,找到第一个关键字大于pivotkey的记录和枢轴记录互相交换,重复两步直至low==high为止。具体实现:public
2016-08-21 15:58:51 244
转载 java arrays sort
Java Arrays中提供了对所有类型的排序。其中主要分为Primitive(8种基本类型)和Object两大类。 基本类型:采用调优的快速排序; 对象类型:采用改进的归并排序。一、对于基本类型源码分析如下(以int[]为例): Java对Primitive(int,float等原型数据)数组采用快速排序,对Object对象数组采用归并排序。对这一区别,
2016-08-21 10:34:43 632 1
转载 博客积分规则
博客积分是CSDN对用户努力的认可和奖励,也是衡量博客水平的重要标准。博客等级也将由博客积分唯一决定。积分规则具体如下:1、每发布一篇原创或者翻译文章:可获得10分;2、每发布一篇转载文章:可获得2分;3、博主的文章每被评论一次:可获得1分;4、每发表一次评论:可获得1分(自己给自己评论、博主回复评论不获得积分);5、博文阅读次数每超过100次:可获得1分,阅读加分最高加到100分,即文章
2016-08-21 10:23:26 370
原创 冒泡排序
冒泡排序: {49,38,65,97,76,13,27,49}代码:public class bubbleSort { public static void main(String[] args) { int[] a = {49,38,65,97,76,13,27,49}; int len = a.length; int count = 0; for(int i = 0
2016-08-21 10:10:43 259
原创 搬宿舍
题:左右手的重量差的平方为疲劳度,对于n个物体,求其中k对物品的最小疲劳度.这个问题好奇怪,我用java写的总是WR。代码如下:版本1:import java.util.Arrays;import java.util.Scanner;public class banqinshi{ public static void main(String[] args) { Scann
2016-08-21 01:53:57 249
原创 LCS最长公共子序列
题:给定两个字符串,求两个字符串公共的子序列中的最长长度。这个刚开始想看答案,后来自己想想发现也不难想。代码:public class lcs { public static void main(String[] args) { String a1 = "abcd"; String a = '1'+a1; int lena = a.length(); String
2016-08-20 22:09:09 227
原创 拦截导弹-最长递增子序列LIS
题:发射的导弹序列,而拦截系统有缺陷,每次只能拦截不比上一次高的导弹。输入:敌国导弹数量k 敌国K个导弹序列输出:最长能够拦截的导弹数目。代码:import java.util.Scanner;public class stopIsle { public static void main(String[] args){ Scanner scanner = new
2016-08-20 21:30:29 229
原创 错排公式
错排公式:f(n) = (n-1)f(n-1)+(n-1)f(n-2)例子:有N封信,每封信对应地址,求把每封信的地址都写错的(写成了其他信的地址)的可能性数。代码:public class WrongOrder { public static void main(String[] args) { int[] f = new int[10]; f[1] = 0; f[2
2016-08-20 20:52:21 229
原创 outer
才发现java里还有个神奇的outer,我之前好多代码处理环节简直是弱爆了。。outer可以用在break,continue,等其中break示例如下:public class out { public static void main(String[] args) { lx: for(int i = 0 ; i < 6 ; i++){ for(int j = 0 ;
2016-08-20 14:56:57 202
转载 collection详解
两个月之前准备软考时,简单的从理论上总结了最常用的数据结构和算法,比如:线性表,链表,图。在进行Java开发时,jdk为我们提供了一系列相应的类来实现基本的数据结构。jdk所提供的容器API位于java.util包内。本文主要是通过简单的介绍Collection集合,向读者简单阐述各个类的基本定义以及其作用,为后面的学习做一下铺垫。首先,我们先看一下Collection集合的基
2016-08-20 00:32:09 1551
原创 递归实现打印一个数组的所有排列
代码:import java.util.ArrayList;import java.util.List;public class tmp { public static void main(String[] args) { List s = new ArrayList<>();//数组列表方便数组大小变动。 List sr = new ArrayList<>(); for
2016-08-19 23:50:01 1616
原创 上楼梯
上楼梯问题,每次可以上一级或者两级,问:给定的楼梯层数,可有多少种方法到达楼梯顶。解析:当楼梯1级时,可有一中上法。2级时,有1+1,2两种走法当大于2级时,对于最后一次上楼梯,可以上一级或者两级:f[n-1]+f[n-2]。则:public class ladder { public static void main(String[] args) { Scanner sc
2016-08-19 19:39:19 355
转载 分支限界法
一、基本描述 类似于回溯法,也是一种在问题的解空间树T上搜索问题解的算法。但在一般情况下,分支限界法与回溯法的求解目标不同。回溯法的求解目标是找出T中满足约束条件的所有解,而分支限界法的求解目标则是找出满足约束条件的一个解,或是在满足约束条件的解中找出使某一目标函数值达到极大或极小的解,即在某种意义下的最优解。 (1)分支搜索算法 所谓“分支”就是采用广度优
2016-08-19 10:30:13 380
转载 回溯
1、概念 回溯算法实际上一个类似枚举的搜索尝试过程,主要是在搜索尝试过程中寻找问题的解,当发现已不满足求解条件时,就“回溯”返回,尝试别的路径。 回溯法是一种选优搜索法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技术为回溯法,而满足回溯条件的某个状态的点称为“回溯点”。 许多复杂的
2016-08-19 10:29:34 211
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人