新手程序员在这里寻求帮助。我有一个看起来像这样的数据框:
Cashtag Date Message
0 $AAPL 2018-01-01 "Blah blah $AAPL"
1 $AAPL 2018-01-05 "Blah blah $AAPL"
2 $AAPL 2019-01-08 "Blah blah $AAPL"
3 $AAPL 2019-02-09 "Blah blah $AAPL"
4 $AAPL 2019-02-10 "Blah blah $AAPL"
5 $AAPL 2019-03-01 "Blah blah $AAPL"
6 $FB 2018-01-03 "Blah blah $FB"
7 $FB 2018-02-10 "Blah blah $FB"
8 $FB 2018-02-11 "Blah blah $FB"
9 $FB 2019-03-22 "Blah blah $FB"
10 $AMZN 2018-04-13 "Blah blah $AMZN"
11 $AMZN 2018-04-29 "Blah blah $AMZN"
12 $AMZN 2019-07-23 "Blah blah $AMZN"
13 $AMZN 2019-07-27 "Blah blah $AMZN"
我想要的输出是一个DataFrame,它告诉我每个公司的样本中每年每个月的消息数量。在此示例中,它将是:
Cashtag Date #Messages
0 $AAPL 2018-01 02
1 $AAPL 2019-01 01
2 $AAPL 2019-02 02
3 $AAPL 2019-03 01
4 $FB 2018-01 01
5 $FB 2018-02 02
6 $FB 2019-03 01
7 $AMZN 2018-04 02
8 $AMZN 2019-07 02
我尝试了.groupby()的许多组合,但尚未实现解决方案。
如何获得所需的输出?