以抽取“豆瓣电影排行榜”网页的超链接为例,分布讲解如何抽取HTML网页的数据,并保存至数据库etl中的数据表html(需提前创建)中。
一,创建转换
二,配置“自定义常量数据”控件
1,“元数据”选项卡的配置
2,“数据”选项卡的配置
具体效果如图。
完成配置。
三,“HTTP client”控件的配置
四,“java代码”控件的配置
1,基础配置
以抽取“豆瓣电影排行榜”网页的超链接为例,分布讲解如何抽取HTML网页的数据,并保存至数据库etl中的数据表html(需提前创建)中。
一,创建转换
二,配置“自定义常量数据”控件
1,“元数据”选项卡的配置
2,“数据”选项卡的配置
具体效果如图。
完成配置。
三,“HTTP client”控件的配置
四,“java代码”控件的配置
1,基础配置