程序目录
/home/volume/zidongshengchengwejian/scripts
获取html内容
上传的图片存放在图片库中,选择其中一个目录打开,获取html内容。
cd /home/volume/zidongshengchengwejian/scripts/outputHttp
拷贝内容粘贴到outputHttp下的文件中,文件名随意,建议a,b,c依次延续
提取图片url
cd /home/volume/zidongshengchengwejian/scripts/
rm -rf aa
python picture.py ./aa ./outputHttp/
aa 目录为存放爬取后图片路径的目录
outputHttp 目录为存放原始html内容文件的目录
url去重并添加域名
cat aa/picture | sort | uniq | sed 's/^/http:\/\/member.91huoke.com\//g' > aa/pictures
上传url到数据库
python3 operate_MySQL.py <USER_ID> <PRODECT_ID> ./aa/pictures
<USER_ID> 和<PRODECT_ID>分别对应数据库中的用户ID和产品ID,例如
python3 operate_MySQL.py 19 19 ./aa/pictures