Stanford University CS144 Lab1 Stitching Substrings Into a Byte Stream

最新推荐文章于 2023-11-20 08:00:00 发布

Love 6

最新推荐文章于 2023-11-20 08:00:00 发布

阅读量375

点赞数 2

分类专栏： # Stanford University CS144 文章标签： cs144 计算机网络

本文链接：https://blog.csdn.net/qq_37500516/article/details/120364905

版权

Stanford University CS144 专栏收录该内容

5 篇文章 2 订阅

订阅专栏

文章目录

前引

终于终于把Lab1给过掉了哎呀不容易没过掉Lab1的几天中我试了大概如下的数据结构 vector<char> deque<char> unordered_map<int,string> unordered_set<string> + priority_queue<int> 无一不以失败告终

到最后功夫还是不负有心人终于实现了出来

写完这个Lab的博客我就去吃午饭^^ 内容很多少说闲话了那大家往下面看吧

Lab1 Stitching Substrings Into a Byte Stream

获取实验文档+调试方法介绍

老样子啊下面为了方便大家于是给了Lab的文档链接的
CS144实验文档获取链接
CS144 Lab Assignments

下载这个即可
在这里插入图片描述

以后每篇博客里面都贴一下调试方法的链接吧哈哈还是挺有用的
Stanford University CS144 调试方法

1、Collaboration Policy(协作原则)

下面是原文但是就不说了意思就是可以freely ask questions but not to post any source code 禁止贴源码
但其实我这样写Lab 其实还是违反了规定的但是呢我还是希望i hope it can give u some ideas but please not to copy my code :( it was not my intention

这部分就先写到这里

2、Overview(总览)

我们实验Lab0 Lab1 Lab2 Lab3 Lab4最终要达成的目的就是手撕一个TCP 只不过是以模块化的形式一点点实现所以更要求我们的代码需要严谨+严谨我在之前的Lab0中原来写错过代码但是因为测试用例不多还是过了到后面因为Lab0错了所以导致我的Lab1也通不过 - -

下面是机翻的Lab1-Lab4的实现

1.在实验1中，您将实现一个流重新汇编器——一个模块，它将字节流的小部分（称为子字符串或片段）缝合成正确序列的连续字节流。

2.在实验2中，您将实现TCP中处理流入站的部分：TCPCrmitver。这包括考虑TCP如何表示每个字节在流中的位置——称为“序列号”。TCP接收器负责告诉发送者(a)它能够成功组装多少入站字节流（这称为“确认”）和(b)现在允许发送者再发送多少个字节（“流控制”）。

3.在实验3中，您将实现处理出站字节流的TCP部分：TCPSender。当发送方怀疑它传输的片段在途中丢失并且从未到达接收方时，应该如何反应？什么时候应该再试一次并重新传输丢失的段？

4.在实验室4中，您将结合以前到实验室的工作，创建一个工作的TCP实现：一个包含TCPSender和TCPCemitever的TCP连接。您将使用它来与世界各地的真实服务器对话。

下面是我们的实现总览图

在这里插入图片描述

3、Getting started(开始)

下面就正式开始实验啦开始实验之前我们需要获取Lab1所需要的代码老样子我们进入sponge 然后输入命令``

我们的Lab1所需材料就成功获取啦和Lab0一样如果编写程序编写好了进入build目录输入make编译
在这里插入图片描述

我们需要编写的程序是在sponge/libsponge 一个是stream_reassembler.cc 还有stream_reassembler.hh

在这里插入图片描述

4、Putting substrings in sequence(按顺序放置子字符串)

这里我就不像Lab0那样跟保姆一样哈哈哈一点点的展开讲了愿意写这个Lab的hxd 相比都是有一定的自己处理文档和信息的能力的这里我就讲一下注意事项和实现思路还有文档的一些细节处理讲完之后我就把代码贴出来吧如果有hxd实在不清楚怎么实现的可以看一下我的代码

下面放一下图和函数注释的机翻

//构造一个`流汇编器`，将存储多达`容量`字节。
简化的重新汇编器（连续的size_t容量）；

//接收一个子字符串，并将任何新的相邻字节写入流中，
//，同时保持在`容量`的内存范围内。将使用的字节
//当超过容量时，它会被悄悄丢弃。
//
//`数据`：子串
//`索引`表示`data`中第一个字节的索引（按顺序放置）
//`eof`：这个子字符串的最后一个字节将是整个流中的最后一个字节
voidpush_substring(连续字符串和数据，连续uint64_t索引，连续push_substring)；

//访问重新组装的字节流（来自实验室0的代码）
ByteStream&stream_out()；

//已存储但尚未重新组装的子字符串中的字节数
size_tunassembled_bytes()同意；

//内部状态是否为空（输出流除外）？
bool空()const；

在这里插入图片描述

1、实现前的建议

可能是这段时间没有休息好也可能是没有规划好直接开干对于CS144 这个Lab 下面的建议是我拿了无数的挥霍小时总结出来的

1、最重要的一点在你打算思考之前先仔细仔细再仔细的看一下实验文档中函数具体要做成的目的这个Lab实现目的是什么有哪些地方需要注意输出的时候规则是什么是否选择丢弃多余的还是保留多余的字节什么时候输入输入的时候是否需要丢弃多余的字节是否保留乱序字节这些
2、开始敲代码前当你开始写第一行代码的时候务必务必一定一定要思考清楚全局怎么布局用什么的数据结构去存储对于一些细节的地方可以先在草稿本上画一下因为确实很多地方处理很细节需要斟酌范围或者思考怎么处理
3、敲代码每一行的时候需要仔细仔细再仔细一点没有想清楚之前就先别打代码可以在草稿本上面先画很多时候因为细节而过不了phase是很正常的
4、实在没有思路先看一下别人的实现思路别一行行的看看个大概后自己实现照抄的话提升几乎为0 建议每一行代码都是自己去实现
5、还是在最后的时候说一句注意实现的细节第一点真的很重要我就是因为不了解实验的很多细节导致出现了偏差从而导致整个实现都出来偏差而到最后从头来过了很多次一定要先明白函数需要我们干什么对于一些地方文档中会告诉我们应该怎么处理

好了写了那么多就是希望大家能少绕一些弯路
先明白明确实验目的函数实现细节远比直接上手省超级超级多的时间

2、Lab中的注意事项

这里我还是得好好交代一下因为这里就关乎代码怎么去实现了

1、这里的容量和我们的第一个Lab的字节流处理的容量是单独分开的 各是各的刚开始我看图没仔细看下面的英文还以为capacity是一起的 - - 注意一下这里是各管各的
2、输入的字符串可以把其当作全是正确的子字符串只不过可以是乱序的我们要做的就是把乱序的字符串存储并按照正确的顺序输出给字节流(Lab0所实现的)
3、输入进来的字符串如果不是按照顺序进来的画是需要缓存下来的缓存下来的字符串可能有完全一样的有部分重叠有完全不挨着的我们需要自己去处理这些字符串如果输入进来的字符串我们在储存的时候发现多出来的字节我们就需要丢弃
4、我们输出字符串到字节流的时机即我们只要有按照顺序的字符串准备好了我们就输出过去但是如果字节流的接受空间已经满了那我们就需要停止输入暂时堵塞
5、我们默认开始序号为0 即如果刚开始我们向字节流输入的第一个字节序号应该是0

3、代码实现思路

下面就要讲一下我的实现思路了在这里必须要感谢一下下面链接的博主我的思路启发是因为它的实现思路

【计算机网络】Stanford CS144 学习笔记

真的还是很佩服他想到的这个思路同样还是觉得需要不断地努力啊
我先说一下为什么deque vector实现并不好实现吧首先就是我们用这个来实现的话就跟Lab0 一样尽管可以处理重叠前后的字符串问题但是我们怎么来处理size这个问题呢根据序号来存储我们需要记忆住每个数据包的index 对于deque vector基本上下表就是我们来记忆index的而且对于已经输入字节流进去的部分我们需要做删除处理那如果刚开始输入进来的index是 1 之后是10001 那我们怎么处理呢没法处理- -（实践出真知）

第二个是对于unordered_map实现起来有难度首先的就是如何排序其实这个map确实不好实现第一个是脑子没转过来没有想到用map - - 其实map也是可以的只不过map一般是用于找寻是否存储了我们的目标对于这种需要排序的而对是否存储快速寻找的这种需求不大所以我们采用set

对于数据结构介绍清楚了下面就到了处理字符串的时候了
下面就是很多地方具体实现思路了如果想自己实现的话就别往下看了 - - 因为这个Lab核心就是怎么处理字符串看了思路的话难度就小了几倍了如果思考了很久还是觉得无从下手的话再看看看完下面的思路能不能自己实现出来

处理字符串我们对于index+data.size() < start_idx的不做处理直接掠过
对于字符串index 小于 start_idx 前面小于start_idx部分直接丢弃然后把index设置为start_idx data剩余部分留着

通过重载< set可以进行排序了
我们每次就看set中有没有字符串index 大于等于的我们即将要插入的index 如果index + data.size() < find_str.startpos 则说明没有交集我们再进入处理要插入的字符串与 set中离我们最近小于我们要插入的index的字符串如果还是没有交际直接插入即可

如果对于第一个情况有交集的话我们直接删除我们find出来的那个字符串并对两个字符串进行合并对于第二个情况也是出现交际我们把我们find出来的字符串删除先进行合并再删除那个元素

最后要插入的时候插入长度是min(我们目前剩余的空间,字符串长度)

输出的话如果字节流空间满了则不输出了 break 如果要输出的字符串长度大于剩余空间我们就把能输出的部分给输出了不能输出的部分就留下来改一下startpos重新放到set中

4、最终代码实现(stream_reassembler.cc stream_reassembler.hh)

代码实现(stream_reassembler.hh)

#ifndef SPONGE_LIBSPONGE_STREAM_REASSEMBLER_HH
#define SPONGE_LIBSPONGE_STREAM_REASSEMBLER_HH

#include "byte_stream.hh"

#include <cstdint>
#include <string>
#include <set>

//! \brief A class that assembles a series of excerpts from a byte stream (possibly out of order,
//! possibly overlapping) into an in-order byte stream.
class StreamReassembler {
  private:
    struct node
    {
        long startpos;
        std::string str;
        node(long index,std::string& s) :startpos(index),str(s) {}
        bool operator<(const node& b) const {return this->startpos < b.startpos;} 
    };
    
    std::set<node> bytes{};
    ByteStream _output;  //!< The reassembled in-order byte stream
    size_t _capacity;    //!< The maximum number of bytes
    size_t _unassembled_bytes = 0;
    long start_idx = 0,end_idx = -1;
    bool _eof = false;
    
    
  public:
    //! \brief Construct a `StreamReassembler` that will store up to `capacity` bytes.
    //! \note This capacity limits both the bytes that have been reassembled,
    //! and those that have not yet been reassembled.
    int merge_nodes(const node& a,const node& b);
    
    StreamReassembler(const size_t capacity);

    //! \brief Receive a substring and write any newly contiguous bytes into the stream.
    //!
    //! The StreamReassembler will stay within the memory limits of the `capacity`.
    //! Bytes that would exceed the capacity are silently discarded.
    //!
    //! \param data the substring
    //! \param index indicates the index (place in sequence) of the first byte in `data`
    //! \param eof the last byte of `data` will be the last byte in the entire stream
    void push_substring(const std::string &data, const uint64_t index, const bool eof);

    //! \name Access the reassembled byte stream
    //!@{
    const ByteStream &stream_out() const { return _output; }
    ByteStream &stream_out() { return _output; }
    //!@}

    //! The number of bytes in the substrings stored but not yet reassembled
    //!
    //! \note If the byte at a particular index has been pushed more than once, it
    //! should only be counted once for the purpose of this function.
    size_t unassembled_bytes() const;

    //! \brief Is the internal state empty (other than the output stream)?
    //! \returns `true` if no substrings are waiting to be assembled
    bool empty() const;
};

#endif  // SPONGE_LIBSPONGE_STREAM_REASSEMBLER_HH

代码实现(stream_reassembler.cc)

#include "stream_reassembler.hh"

// Dummy implementation of a stream reassembler.

// For Lab 1, please replace with a real implementation that passes the
// automated checks run by `make check_lab1`.

// You will need to add private members to the class declaration in `stream_reassembler.hh`

template <typename... Targs>
void DUMMY_CODE(Targs &&... /* unused */) {}

using namespace std;

StreamReassembler::StreamReassembler(const size_t capacity) : _output(capacity), _capacity(capacity) {}

//! \details This function accepts a substring (aka a segment) of bytes,
//! possibly out-of-order, from the logical stream, and assembles any newly
//! contiguous substrings and writes them into the output stream in order.

int StreamReassembler::merge_nodes(const node& lower,const node& higher)
{
    long lower_endpos = lower.str.size() + lower.startpos;
    long newstr_size = -1,higher_strsize = higher.str.size();
    if(lower_endpos >= higher.startpos)
    {
        newstr_size = 0;
        if(lower.startpos < higher.startpos)
            newstr_size += (higher.startpos - lower.startpos);
        
        long lower_plus = (lower_endpos - higher.startpos);
        newstr_size += max(lower_plus,higher_strsize);
    }  
    return newstr_size;
}

void StreamReassembler::push_substring(const string &data, const size_t index, const bool eof)
{
    long endpos = index + data.size(),idx = index;
    string sub_str = data;
    if(_eof || endpos < start_idx) return;
    if(eof) end_idx = index + data.size();
    if(idx < start_idx)
    {
        sub_str = data.substr(start_idx-idx);
        idx = start_idx;
    }    
        
    node insert(idx,sub_str);
    while(true)
    {
        auto iter = bytes.lower_bound(insert);
        long newstr_size = 0;
        if(iter != bytes.end() && (newstr_size = merge_nodes(insert,*iter)) >= 0)
	{
	    long delpos = iter->startpos - insert.startpos;
	    long tmp_size = iter->str.size();
	    if(newstr_size == tmp_size + delpos)  
	        insert.str = insert.str.substr(0,delpos) + iter->str;
	    _unassembled_bytes -= iter->str.size();    
	    bytes.erase(iter);
	}
	else break;
    }
    
    do
    {
        auto iter = bytes.lower_bound(insert);
	if(iter == bytes.begin()) break;
	--iter;
	long newstr_size = 0;
	if((newstr_size = merge_nodes(*iter,insert)) >= 0)
	{
	    long delpos = insert.startpos - iter->startpos;
	    long tmp_size = insert.str.size();
	    if(newstr_size == tmp_size + delpos)  
	        insert.str = iter->str.substr(0,delpos) + insert.str;
	    else   insert.str = iter->str;
	    insert.startpos = iter->startpos;
	    _unassembled_bytes -= iter->str.size(); 
	    bytes.erase(iter);
	}
	else break;
    } while(true);
    
    size_t max_insert_size = min(_capacity - _unassembled_bytes,insert.str.size());
    insert.str = insert.str.substr(0,max_insert_size);
    bytes.emplace(insert);
    _unassembled_bytes += insert.str.size();
    
    auto iter = bytes.begin();    
    while((iter = bytes.begin()) != bytes.end() && iter->startpos == start_idx && _output.remaining_capacity() > 0)
    {
        long send_bytes = min(iter->str.size(),_output.remaining_capacity());
        string send_str = iter->str.substr(0,send_bytes);
        _output.write(send_str);
        _unassembled_bytes -= send_str.size();
        start_idx += send_str.size();
        if(send_str.size() != iter->str.size()) 
        {
            insert.startpos = iter->startpos + send_str.size();
            insert.str = iter->str.substr(send_str.size()); 
            bytes.emplace(insert);
        }
        bytes.erase(iter);
    }
    
    if(start_idx == end_idx)
    {
        _output.end_input();
        _eof = true;   
    }
}

size_t StreamReassembler::unassembled_bytes() const 
{
    return _unassembled_bytes; 
}

bool StreamReassembler::empty() const 
{ 
    return unassembled_bytes() == 0; 
}

5、编译运行测试用例检验程序 (100% tests passed)

对了这里提一嘴大家记得把代码一定要备份一份如果会git的话要记得送上去如果不会的话一定要在一些地方把代码拷贝下来以后之后修改了出错了改不回去了 - -

我们老样子进入sponge/build make make完后 make check_lab1 如下图终于写完了吃饭去了大家有缘下一个Lab见希望这个部分不要出错哈哈哈各位再见

在这里插入图片描述

Love 6

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Stanford University CS144 Lab1 Stitching Substrings Into a Byte Stream

文章目录前引Lab1 Stitching Substrings Into a Byte Stream获取实验文档1、Collaboration Policy(协作原则)2、Overview(总览)3、Getting started(开始)4、Putting substrings in sequence(按顺序放置子字符串)1、实现前的建议2、Lab中的注意事项3、代码实现思路4、最终代码实现(stream_reassembler.cc stream_reassembler.hh)代码实现stream_rea
复制链接

扫一扫