准备工作
- 数据库:初步三张表——用户表,电影表,收藏表
- 重点:获取电影相关数据
利用爬虫技术,获取豆瓣相关电影数据,整合录入mysql数据库-
问题(不想看可以跳过)
爬虫是基于python(相对熟悉一点,虽然java也能干,细节不详述)。
最后通过python处理保存为json文件。java在处理json文件时,使用的是json官方的包。在解析json字符串的过程中
碰到了一个问题
net.sf.json.JSONException: A JSONObject text must begin with '{' at character 1 of
网上分为 :
1:json字符串格式不对
2:文件编码,文件头部隐藏的代码( utf-8无rom 这种情况以前在处理文件时碰到过,只是这一次不是)
解决过程:开始确实时json字符串格式不对修改后,还是不行。文件编码没问题,反复检查了。中间花了大量的时间在查找相关问题上。
最后没办法,仔细读了一下报错:must begin with ‘{’ at character 1 of
意思是,必须在开始的第一个字符使用’{‘。
一下子明白了过来——我的json字符串是数组形式即 [ ],而要求则是使用 { 开头即表示整体是一个对象其次一点的问题就是在插入数据的过程中调整数据的类型和结构花了一下功夫,但是没卡
-
总结
- 由于在json的处理上花了貌似很多无用功,但是在思考的过程中,能够让自己对于json的结构和处理方式有一定的理解和心得。最大的收获也就是对json的认知,其次是数据库相关操作的复习