分享一些简单的内容

最新推荐文章于 2020-08-24 10:15:24 发布

shelgi

最新推荐文章于 2020-08-24 10:15:24 发布

阅读量260

点赞数

分类专栏： java python 文章标签： python java爬虫

本文链接：https://blog.csdn.net/shelgi/article/details/106579024

版权

python 同时被 2 个专栏收录

43 篇文章 3 订阅

订阅专栏

java

3 篇文章 0 订阅

订阅专栏

文章目录

1.使用java简单爬取CSDN
2.python的字符动态输出

1.使用java简单爬取CSDN

最近在看爬虫相关的知识，其实还是那句话，万变不离其宗。得到网页，然后解析就可以得到我们想要的内容了，但是现在很少用java写爬虫的吧，所以写了一个java爬虫玩一下。

目标网站: CSDN首页
然后java爬虫需要httpcilent请求，jsoup解析，相应的jar包链接如下，下载就好。
链接
提取码：63kv

然后就是代码：

package com.company;

import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.config.CookieSpecs;
import org.apache.http.client.config.RequestConfig;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.HttpClientBuilder;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 * @author shelgi
 */
public class Main {

    public static void main(String[] args) throws Exception{
	// write your code here
        HttpClient client = HttpClientBuilder.create().build();
        HttpGet hget=new HttpGet("https://www.csdn.net/");
        RequestConfig defaultConfig = RequestConfig.custom().setCookieSpec(CookieSpecs.STANDARD).build(); hget.setConfig(defaultConfig);
        hget.setHeader("user-agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36");
        HttpResponse response=client.execute(hget);
        String content= EntityUtils.toString(response.getEntity(),"utf-8");
        //jsoup解析网页
        Document doc = Jsoup.parse(content);
        String title=doc.title();
        System.out.println("标题为:"+title);
        Elements links=doc.select("#feedlist_id > li> div > div.title > h2 > a");
        System.out.println(links);
        for(Element link:links){
            System.out.println(link.text()+":"+link.attr("href"));
        }
    }
}

运行效果
在这里插入图片描述

2.python的字符动态输出

经常看那些很老的游戏，出现的提示语都是一个字一个字的慢慢出现，现在python也可以实现这个效果，说不定还能用这个做个简单的小游戏呢，话不多说直接上代码。

import sys
import time

question="今天，你学习了吗？"

for word in question:
    sys.stdout.write(word)
    sys.stdout.flush()
    time.sleep(0.2)

在这里插入图片描述

shelgi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
分享一些简单的内容

文章目录1.使用java简单爬取CSDN2.python的字符动态输出1.使用java简单爬取CSDN最近在看爬虫相关的知识，其实还是那句话，万变不离其宗。得到网页，然后解析就可以得到我们想要的内容了，但是现在很少用java写爬虫的吧，所以写了一个java爬虫玩一下。目标网站: CSDN首页然后java爬虫需要httpcilent请求，jsoup解析，相应的jar包链接如下，下载就好。链接提取码：63kv然后就是代码：package com.company;import org.apac
复制链接

扫一扫