jsoup网上抓取资源到入库超详细

  

1.首先拿到网址,自己先去网址上看看需要抓取的数据,并确定实体类bean,并且建好对应的表结构

我使用的是创建maven项目,也可以使用一般的Java项目,下载对应的jar包放进去别忘了buildpath,使用的jsoup,还需要入库,我是用的oracle,所以导入的是ojdbc,以及一些相应的依赖包

   这是个国外的网站,抓取到的数据是英文的,尝试了webservice翻译和模拟某度翻译,但是效果都不好,webservice调用别的服务每次的翻译请求间隔不能太短,所有取消自动翻译,让人工确认,

若需要锁定环境版本,在pom.xml中添加下面内容,我的是1.8+

    <build>
        <pluginManagement>
            <plugins>
                <plugin>
                    <groupId>org.apache.maven.plugins</groupId>
                    <artifactId>maven-compiler-plugin</artifactId>
                    <version>3.2</version>
                    <configuration>
                        <source>1.8</source>
                        <target>1.8</target>
                        <encoding>utf8</encoding>
                        <showWarnings>true</showWarnings>
                    </configuration>
                </plugin>
            </plugins>
        </pluginManagement>

    </build>

1.2创建实体类bean,提供相应的构造方法和getter和setter方法

2.创建连接数据的工具,调整自己的数据连接信息

如果程序启动过程中遇到

unable to find valid certification path to requested target

请移步看我另一解决步骤:

https://blog.csdn.net/wzc1991520/article/details/79442304


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值