超简单代码记录
要求根据给的父子关系,给出祖父子级的关系。
给定表:
最终输出:
原本是课上的一个作业,目的是学习mapreduce,一开始不知道,用python直接做了,发现超简单。
记录一下,留念。
import pandas as pd
reader = pd.read_csv('child-parent.csv')
gc2gp = []
for i in range(0, reader['child'].size - 1):
for j in range(0, reader['child'].size - 1):
if reader['parent'][i] == reader['child'][j]:
gc2gp.insert(0, [reader['child'][i], reader['parent'][j]])
pd.DataFrame(columns=['grandchild', 'grandparent'], data=gc2gp).to_csv('grandchild-grandparent.csv', encoding='utf-8')
其实一代码不是这样,后来就想看看到底能把代码减少到多少行,最终减少到8行,本来还能再减,但是如果再刻意减少就显得很不美观了。
最后给出一个网上找到的hadoop的代码的链接: