- 博客(9)
- 收藏
- 关注
原创 项目实训第三周工作(3)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。以上是本周的劳动成果包括:食谱id+名+材料+url.csv食谱id+食谱url+对应用户+关系.csv用户ID+url+密码.csvpic100原版.zippic100压缩500像素.zippic100压缩128像素...
2021-07-18 23:02:23 99
原创 项目实训第三周工作(2)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。# 保留对应的import numpy as npintact=np.load("MeishiChina_interaction_data_train_afterdelete_new.npy")print(intact)intactlie = intact[:,0]# p
2021-07-18 22:59:28 124
原创 项目实训第三周工作(1)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。...
2021-07-18 22:57:15 110
原创 项目实训第二周工作(3)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。做了如上两项工作,一个是寻找新数据的优质用户,一个是找他们对应的食谱。...
2021-07-11 22:41:10 91
原创 项目实训第二周工作(2)
我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。经过了一周多的努力,我的数据清洗工作初步已经完成,但是因为爬取的数据的问题导致数据不准确所以我的工作要换一组数据重新做一遍。记录一下吧。...
2021-07-11 22:38:31 72
原创 项目实训第二周工作(1)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。上次,已经得到了关于优质用户的id,与其相关的食谱id与url。基于此,要让负责爬虫的同学依据食谱的url爬出他们的食谱名称,得到结果如下。我要做的是把这些杂乱的菜名,换成其主要且简洁的形式(删除符号与形容词)。删除符号可以用正则表达式匹配,但...
2021-07-07 08:45:39 83
原创 项目实训第一周工作(3)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。本次博客学习与记录内容:找到优质用户对应的食谱与url。1.优质用户 在之前的博客中,记录了查找优质用户的过程,所谓优质用户,即与其相关的食谱数量(包括发布,收藏等交互)在8到10之间的用户。2.查找优质用户对应的食谱与url 目前有三个表...
2021-07-04 12:55:15 95
原创 项目实训第一周工作(2)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。本次博客学习与记录内容:数据清洗。1.pandas库第一次使用 Pandas 之前,我们需要安装 Pandas。在file-settings-python interpret安装。导入pandas:代码如下import pandas as pd2.运用pan..
2021-07-02 09:27:14 91
原创 项目实训第一周工作(1)
项目实训题目:饮食健康管理系统设计与实现我的工作:数据清洗具体工作事项:数据清洗;错误数据处理;图片大小归一化;图片存放位置归并;与数据库同学沟通;不对应(冗余或缺失)图片的删除与处理等。本博客旨在记录工作内容。本次博客学习与记录内容:图片大小归一化与存放位置的归并。1.Pillow库 Pillow是Python里的图像处理库,提供了了广泛的文件格式支持,强大的图像处理能力,主要包括图像储存、图像显示、格式转换以及基本的图像处理操作等; 在网上查找此问题时,出现过PIL库
2021-06-30 09:08:03 88
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人