首先,要先去拿到数据:豆瓣电影Top250 API: https://douban.uieee.com/v2/movie/top250?start= xxx&count=yy(建议用谷歌浏览器)
start: 开始的页面(意思是从第几部电影开始)
count: 页面数(意思是你要取得电影部数)
豆瓣网设置了取值范围,一次只能取100部电影,而且还要一部电影没有演员,因为那是一部记录片
全选复制,可以再打开一个新的网页,也可以换一个浏览器输入json格式解析,选择在线工具
把刚刚复制的内容粘贴到左边的方框里,右边的就会出现像你想要的 json 文件。拿到文件后个人建议粘贴到 Notepad++ 并保存,Notepad++ 是一个文本编辑器,可以去网上搜索下载。
如果你想将这个文件用 kettle 工具输入到MySQL数据库中的话,可以先下载相应的软件,比如,MySQL;kettle;java的jdk;连接MySQL数据库的工具;比如,Navicat Premium等(连接MySQL数据库的工具不止是这个,还要很多,本人用的是这款工具,所以向大家推荐)。下好所需的应用后,在 Navicat Premium 里建一个连接
选中 MySQL 取名输入密码(密码就是安装JDK时的密码),连接成功后又键连接名,新建数据库(数据库名称建议不要用中文和数字),建完数据库再点击表又键新建表,
然后添加字段把你想取的名字输入进去;保存前选中字符集找到 utf8 之后再保存,保存名为 t_moive
做完上面步骤之后打开 kettle
点击文件》新建》转换,找到 input ,把JSON INPUT 拉到操作界面,找到输出,把表输出拉到操作界面,然后连线
双击JSON INPUT 进行配置点击文件》浏览》增加,增加的是你保存的json 文件的路径
点击字段,进行字段配置,配置完后进行预览
到这里 JSON Input 的配置已经完了,转到表输出配置,双击表输出,点击新建,写上连接名,找到MySQL,主机名为 localhost ,写上你在 Navicat Premium 上建的数据库名称,输入用户名和密码进行连接测试。
确认后点击目标表,选中你建的表
把指定数据库字段打勾,点击数据库字段,点击获取字段之后表输出完成配置,点击启动
输出成功后会打绿勾,如果出错它会显示红色
最后一步,到Navicat premium 那边进行刷新就能看到我们经常看到的表格式的电影信息
注意:如果想要拿到这样的豆瓣TOP 250 部电影的信息,则需要重复以上步骤四次,因为我之前说过有一部电影没有演员,在JSON Input 的字段中,如果数据不一样则会报错,所以把那一部没有演员的电影单独拿出来进行输出。
豆瓣电影TOP 250 kettle的输出
最新推荐文章于 2024-04-20 10:00:41 发布