Python自然语言处理 第一章 练习题答案 Natrural Language Processing with Python Ans for Chapter 1

这篇博客详细解答了《Python 自然语言处理》第一章的练习题,内容涵盖语言计算、词汇多样性、字符串操作、链表应用、条件语句等,通过实例深入探讨Python在NLP中的应用。
摘要由CSDN通过智能技术生成

第一章 练习题答案

(正在学习中,将继续更新~欢迎大家留言~喜欢的话给个赞再走吧_(:з)∠)_)
(补充修改+借鉴了前辈们已发布的答案)

  1. 尝试使用Python 解释器作为一个计算器,输入表达式,如12/(4+1)。

    >>>12/(4+1)

  2. 26 个字母可以组成26 的10 次方或者26**10 个10 字母长的字符串。也就是1411
    67095653376L(结尾处的L 只是表示这是Python 长数字格式)。100 个字母长度的
    字符串可能有多少个?

    >>>26**100

  3. Python 乘法运算可应用于链表。当你输入[‘Monty’, ‘Python’] * 20 或者 3 * se
    nt1 会发生什么?

    复制n次

  4. 复习1.1 节关于语言计算的内容。在text2 中有多少个词?有多少个不同的词?

    >>>len(text2) 141576

    >>>len(set(text2)) 6833

  5. 比较表格1-1 中幽默和言情小说的词汇多样性得分,哪一个文体中词汇更丰富?

    幽默小说

  6. 制作《理智与情感》中四个主角:Elinor,Marianne,Edward 和Willoughby 的分布图。在这部小说中关于男性和女性所扮演的不同角色,你能观察到什么?你能找出一对夫妻吗?

    text2.dispersion_plot(['Elinor','Marianne','Edward','Willoughby'])![Figure_1](C:\Users\Busket’s PC\Desktop\Figure_1.png)

    正确答案是Elinor和Edward。那啥,我觉得Edward和Willoughby相反出现明明更有趣啊~

  7. 查找text5 中的搭配。

    >>>text5.collocations()
    wanna chat; PART JOIN; MODE #14-19teens; JOIN PART; PART PART;
    cute.-ass MP3; MP3 player; JOIN JOIN; times … .; ACTION watches; guys
    wanna; song lasts; last night; ACTION sits; -…)…- S.M.R.; Lime
    Player; Player 12%; dont know; lez gurls; long time

  8. 思考下面的 Python 表达式:len(set(text4))。说明这个表达式的用途。描述在执行
    此计算中涉及的两个步骤。

    set(text4) 获取text4的词汇表(无重复) len(set(text4))text4的词汇量

  9. 复习1.2 节关于链表和字符串的内容。
    a. 定义一个字符串,并且将它分配给一个变量,如:my_string = ‘My String’(在
    字符串中放一些更有趣的东西)。用两种方法输出这个变量的内容,一种是通过简
    单地输入变量的名称,然后按回车;另一种是通过使用print 语句。

    >>> my_string = 'My string'
    >>> my_string
    #'My string'
    >>> print (mystring)
    #My string
    

    b.尝试使用my_string+ my_string 或者用它乘以一个数将字符串添加到它自身,
    例如:my_string* 3。请注意,连接在一起的字符串之间没有空格。怎样能解决
    这个问题?

    >>> my_string
    #'My string My string My string'*
    
  10. 使用语法my_sent = [“My”, “sent”],定义一个词链表变量my_sent(用你
    自己的词或喜欢的话)。
    a. 使用’ '.join(my_sent)将其转换成一个字符串。

    >>> my_sent=["My","sent"] 
    >>> ' '.join(my_sent)		#'My sent'
    

    b. 使用split()在你指定的地方将字符串分割回链表。

    >>> 'My sent'.split()		#['My', 'sent']
    
  11. 定义几个包含词链表的变量,例如:phrase1,phrase2 等。将它们连接在一起组
    成不同的组合(使用加法运算符),最终形成完整的句子。len(phrase1 + phrase2)
    与len(phrase1) + len(phrase2)之间的关系是什么?

    相等

  12. 考虑下面两个具有相同值的表达式。哪一个在NLP 中更常用?为什么?
    a. “M

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值