自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 关于字符串的一个题

求第一个无重复字符,如"total"的第一个无重复字符是o,"teeter"的第一个无重复字符是r,效率要优于O(n的平方)public static Character FirstNonRepeated(String)两个方法,第一个比较好理解:1:public class Test {        public static void main(Strin

2017-08-25 16:55:35 545

转载 java堆栈类使用实例(java中stack的使用方法)

java中stack的使用方法,堆栈是一种"后进先出"(LIFO) 的数据结构, 只能在一端进行插入(称为"压栈") 或删除 (称为"出栈")数据的操作,下面看示例吧JAVA 中,使用 java.util.Stack 类的构造方法创建对象。 public class Stack extends vector 构造方法 : public Stack() 创建一个空 S

2017-08-25 13:34:41 4535

原创 java编程分享

1:去掉一个已经排好序的数组的重复数字,然后输出该数组,假设该数组为1,1,2,2,3,3,4,4,4,5,8,8,9,那么输出结果应该为1,2,3,4,5,8,9import java.util.ArrayList;public class alan {        public static void main(String[] args) {        Ar

2017-08-25 10:10:14 399

原创 几个经典编程题(二)

1:有两个有序整数集合a和b,写一个函数找出它们的交集?import java.util.ArrayList;public class Test {  public static void main(String args[]) throws Exception {    int[] a = {2, 3, 4, 4, 4, 4, 7, 8, 8, 8, 8, 9

2017-08-24 14:12:09 560

原创 几个经典的编程题

1:一个农夫养了一头牛,三年后,这头牛每年会生出1头牛,生出来的牛三年后,又可以每年生出一头牛……问农夫10年后有多少头牛?n年呢?不难发现,第一年一头牛,第二年1头牛.....所以大概随着年份增长牛的数量:1,1,2,3,5,8......当前年份的牛的数量等于前两年牛的数量之和,所以:import java.util.Scanner;public class Test{

2017-08-24 11:12:44 1284

原创 求解约瑟夫问题两种方法

1:500个小孩围成一圈,从第一个开始报数:1,2,3,1,2,3,1,2,3,……每次报3的小孩退出 问最后剩下的那个小孩,在以前500人里是第几个???很经典的一个约瑟夫问题,我看了几个大神的算法,用了点时间才搞懂一个大神用的递归思想,非递归算法的求解方法,确实厉害。首先假设这里有10个小孩,我们给他们编号为:0 1 2 3 4 5 6 7 8 9那么第一次

2017-08-23 15:25:41 1177

原创 分享java编程题(二)(网易笔试)

1:小易为了向他的父母表现他已经长大独立了,他决定搬出去自己居住一段时间。一个人生活增加了许多花费: 小易每天必须吃一个水果并且需要每天支付x元的房屋租金。当前小易手中已经有f个水果和d元钱,小易也能去商店购买一些水果,商店每个水果售卖p元。小易为了表现他独立生活的能力,希望能独立生活的时间越长越好,小易希望你来帮他计算一下他最多能独立生活多少天。 输入描述:输入包括一行,四个整数x,

2017-08-22 13:30:55 539

原创 分享java编程题(网易笔试)

1:如果一个数列S满足对于所有的合法的i,都有S[i + 1] = S[i] + d, 这里的d也可以是负数和零,我们就称数列S为等差数列。小易现在有一个长度为n的数列x,小易想把x变为一个等差数列。小易允许在数列上做交换任意两个位置的数值的操作,并且交换操作允许交换多次。但是有些数列通过交换还是不能变成等差数列,小易需要判别一个数列是否能通过交换操作变成等差数列 输入描述:输入包

2017-08-21 13:43:41 1337

原创 python模拟网站登录

想要在python里模拟登录一个网站,最近学习了下,很简单:直接上代码:import selenium.webdriver as webdriverfrom selenium.webdriver.common.keys import Keysdriver=webdriver.Chrome()url='https://graph.qq.com/oauth/show?which

2017-08-19 16:46:35 1485

原创 python:代理ip获取,验证,使用

很多网站服务器都有反爬机制,作为一个用python爬取数据的人,必须掌握怎么破解反爬机制。我们在不断爬取大量数据的时候,ip很可能被网站封住,这样我们就无法继续爬取数据,怎么解决?:代理ip代理ip怎么获取?:你可以百度自行搜索代理ip,然后可以手动粘贴保存,也可以直接对某网站的代理ip进行爬取。但是,我们获得的代理Ip并不是每一个都是有效的,我们德验证ip的有效性。很简单:你

2017-08-16 13:31:41 3449

原创 python爬虫数据保存到本地各种格式的方法

最近爬虫又解决了很多问题,算是保存这部分的吧。首先,我们如果想要抓取本地txt文件中的内容拿到特定网址去搜索。然后爬取搜索结果的话,这个很简单:f=open('C://Python27//1.txt')           #只需要通过这句代码打开你本地对应路径的文件就OK但是如果你想要打开excel表格呢?这里就需要下载xlrd库。百度搜索就可以,解压。在cmd中进入解压文件夹然后输

2017-08-11 15:53:42 18845

原创 python爬虫:网址无法请求和某一特定链接求取方法

首先说一下,我开这个博客,写博客主要是为了记录自己平时学习研究过程中的重点问题,可能格式,表达什么的都会很乱。当然,如果我的问题对大家有所帮助那就更好了,因为我也是一个新人。很多人在用python爬虫时可能会遇到网址无法请求,这是因为很多网页都是加密的,所以我们需要设定特定的headers。res = requests.get("http://www.qichacha.com/search

2017-08-08 08:45:34 2750 1

原创 xpath的使用方法以及python爬取数据的保存

前面写了几篇关于自己爬虫时的进度以及遇到的问题,今天系统的爬取了一个网站之后又对爬虫方法有了更好的认识,所以今天我会尽量用明晰的语言来给大家介绍这些方法。首先说明下我要爬取的内容:http://www.zbj.com/appdingzhikaifa/sq10054601.html          打开这个网址会有很多店铺,我的第一步就是爬取这个网址中店铺所对应的公司名,代码在我前面的文章中有

2017-08-04 14:45:05 3551

原创 通过Python对各个页面链接的有效爬取

前面提到过关于某一页信息的如何爬取,但是我想爬取在下一页面的信息怎么爬取?我不能通过打开下一页,然后获取下一页的网址在通过python爬取吧,这样就和爬取第一页没有什么区别了。有没有办法直接爬取下一页的链接然后get到你获取的url在爬取信息呢?刚开始我想到用正则表达式来匹配各个页面的链接地址,但是可能我的idle版本问题或者别的问题(我也没有解决),总之不能通过。于是我就想先爬取这一

2017-08-02 13:22:27 5734

原创 python爬虫学习过程

首先,如果你有别的语言的基础的话,我感觉可以直接入手python爬虫,然后通过具体实例来完善自己的python;如果没有的话,我感觉还是要答题上了解学习下python;一:了解什么是python爬虫:这个百度什么都有很多解释。二:对于urllib,urllib2库的了解使用,可以爬取网页的源代码,这是你爬取数据的第一步。当然这种源代码的爬取方法很多,request,post,get等等。

2017-08-01 10:43:43 503

原创 关于python爬虫去重问题

我有一篇文章写的关于爬猪八戒网的一些公司名,但是有重复,怎么去重?for result in results:if result.text not in res:res.append(result.text)count+=1可以添加一个list,把你爬下的内容放进去,然后用if判断,看是否已经进行爬取,如果没有就添加。但是这么爬下来有个问题就是他

2017-07-28 17:29:43 2591

原创 关于Linux 学习的整理

以下是我通过看鸟哥的linux还有一些网上别人的教程整理出来的,不是很细。Linux内核由R,X,Y组成;X为偶数表示稳定的版本,奇数表示正在测试的版本。Linux自由软件,源码公开。多任务,多用户。  管理文件权限,管理文件以及目录,管理磁盘与文件系统,文件的打包压缩。文件操作中:echo其实就是打印的意思,echo nihao、ls 在前面的命令中多

2017-07-28 16:06:12 400

原创 jsva程序:正则表达式匹配域名

主要是输入一个域名来判断它是几级域名,可以用到正则表达式。import java.util.Scanner; import java.util.regex.Matcher;import java.util.regex.Pattern;public class zz{private static final String REGEX = "\\b.\\b";

2017-07-28 16:03:30 725

原创 关于手动设置ip和自动获取ip的java小程序

平时我们设置网络连接ip的时候是不是感觉很麻烦,需要去电脑里面设置。所以我写了一个java的自动更改的import java.io.File;import java.io.IOException;import javax.swing.JFrame;import java.awt.*;import java.awt.event.ActionEvent;import java.

2017-07-28 15:52:44 1682

原创 关于python爬取网页上指定内容

最近刚开始接触python,主要是最近工作是关于爬虫方面的。这是自己爬的一个猪八戒网站上面的店铺的链接。因为没接触过python,所以百度了很多大神的方法:http://blog.csdn.net/danielntz/article/details/51861168主要用到了BeautifulSoup。在这里,我感觉最重要的就是关于网页源代码指定信息标签的获取了,因为一直抓

2017-07-28 15:30:12 6453

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除