最近的组内的工作是拿到了需要用的一些数据和核心代码,饮食推荐组和饮食识别组的同学主要研究调通代码,数据清洗和数据采集组的同学开始采集需要用到的食谱数据。
各组进度明细:
开发过程管理组
学习前后端语言,学习高效管理代码。
数据采集与清洗组
食谱信息采集完毕,数据清洗完毕,正在整理成数据库同学所需要的形式,准备与数据库交接。
数据库组
数据库搭建完成,登录接口提供完成。正在等待数据进行数据导入;正在进行提供其他接口;正在研究如何实现远程访问数据库。
用户模块组
后端同学在本地机上的登录功能已经初步实现,正在与数据库同学对接,使用数据库接口完成登录功能;前端同学教程以基本学习完成,正在进行登录页面的搭建和与后端同学的对接。
饮食记录组
已完成在本地的图片上传功能和文字上传功能。正在研究使上传的图片显示在网页上以及与数据库同学的对接。
个人收藏组
已完成饮食收藏界面的初步搭建,正在研究与数据库的连接。
饮食识别组
已完成页面的初步搭建,正在调试饮食识别代码和尝试连接数据库实现图片上传至后台。
社交云组
已实现自定数据的节点连接和登录用户头像在中间的显示,已实现节点信息的获取。正在进行图像显示bug的调试和与数据库的对接。
饮食推荐组
已基本调通算法,已完成页面的初步搭建。正在测试算法BUG情况,正在研究与数据库的对接。
系统测试组
已撰写好各模块详细的测试用例选择。
另外,帮助数据清洗同学利用pandas库完成数据的清洗工作。主要代码如下
import pandas as pd
import numpy as np
inter_data = pd.read_csv('1.csv')
item = pd.read_csv('5.csv')
user =np.load('user_index_list_new.npy')
def getNonRepeatList1(data):
return list(set(data))
df = inter_data.drop_duplicates() #去重
user_inter_count = df['userID'].value_counts() #计算每个用户交互食谱的个数
print(user_inter_count)
num = 0
quality_userid = user_inter_count[user_inter_count.values == 9].index #计算优质用户ID
for id in quality_userid: #判断用户id是否在数据集里
inter_recipe_key = []
if id in user and num < 120:
users_recipe = inter_data[inter_data['userID'] == id]
print(id)
for each in users_recipe['recipeID'].values:
if each not in inter_recipe_key:
inter_recipe_key.append(each)
print(str(each) + "," + str(item['url'].values.item(each)))
num = num + 1
print(len(inter_recipe_key))
print(len(getNonRepeatList1(inter_recipe_key)))
工作日志如下:
总结
经过几天的学习,同学们对前后端语言也都具有了一定的掌握,各组也都在有条不紊的展开当中。现在比较重要和紧迫的是各个模块与数据库的对接,以及登录、主页的搭建和跳转接口的实现。因为现在大家都在各自的电脑上进行,也都各自写了自己的网页来调试功能,没有一个完整的框架来帮助同学们进行开发。所以接下来比较要紧的工作主要有:
1)督促数据库同学提供其他模块的接口
2)尽快实现数据库的远程访问
3)尽快搭建登录页面和主页
4)尽快提供各模块页面跳转的接口