马尔可夫链文本生成c语言,马尔可夫链文本生成

关于这项任务与你在课堂上所涉及的内容的相关性(你的第二个问题)。 “数据结构”类的想法是让学生接触CS中经常遇到的很多结构:列表,堆栈,队列,哈希,各种类型的树,大图,各种信条和贪婪的矩阵等等。提供一些洞察他们的常见实现,他们的优点和缺点,以及他们的各种应用领域。

由于大多数游戏/谜题/问题都可以映射到这些结构的某些组合,因此不乏基于讲座和作业的主题。你的课看起来很有趣,因为在保持对这些结构的关注的同时,你也有机会发现真正的应用。

例如,以一种伪装的方式,“猫和两只狗”的东西是对语言学应用的统计模型的介绍。你的好奇心和动力促使你与马尔可夫模型建立关系,这是一件好事,因为你很有可能在毕业前多见几次“马尔科夫”;-)当然还有CS或相关领域的职业生涯。所以,是的!看起来你似乎在许多应用程序等等,但只要你了解在特定情况下选择什么结构和算法,你就不会浪费你的时间!

现在,关于可能的任务方法的一些提示

trie似乎是对这类问题的自然支持。也许你可以问问自己,如果你不得不索引一整本书而不是这个简短的句子,这种方法会如何扩展。它似乎主要是线性的,虽然这取决于trie中三个跃点的每个选择(对于这个二阶马尔可夫链):随着选择数量的增加,选择路径可能会变得效率降低。

用于构建索引的可能的替代存储是stochatisc矩阵(实际上,如果只有稀疏矩阵,在统计收集过程中,当你规范化每一行 - 或列时,在结束时随机变为“普通” - 取决于你设置它up)总结为一(100%)。这样的矩阵大约是729×28,并且允许在一次操作中索引两个字母的元组及其相关的后续字母。 (包括“开始”和“停止”信号,我得到28,细节......)

这种更高效索引的成本是使用额外的空间。在空间方面,trie是非常有效的,只有存储有效的字母三元组合,矩阵然而浪费了一些空间(你最后赌注它将非常稀疏,甚至在索引更多的文本之后“狗/猫“句子。)

这种大小与CPU的折衷是非常普遍的,虽然有些算法/结构在两个方面都比其他算法/结构更好......而且如果问题被改变为基于选择的话,矩阵方法将无法很好地扩展,大小为wize。前面的字母说三个字。

尽管如此,可能会将矩阵视为替代实现。尝试各种结构并了解他们为什么/在哪里比其他人更好(在特定任务的背景下),这是本课程的精神。

您可以采取的一个小的侧面旅行是根据字母对(或三元组)的概率创建标签云:trie和矩阵都包含所需的所有数据;具有所有有趣属性的矩阵可能更适合于此。

玩得开心!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值