《自然语言处理实战》
文章平均质量分 76
自然语言处理
非文的NLP修炼笔记
研究生在读,NLP小白一枚,希望大家多多指教~
展开
-
《自然语言处理实战:利用Python理解、分析和生成文本》读书笔记:第4章 词频背后的语义
TF-IDF向量会对文档中词项的准确拼写形式进行计数。因此,如果表达相同含义的文本使用词的不同拼写形式或使用不同的词,将会得到完全不同的TF-IDF向量表示。这会使依赖词条计数的搜索引擎和文档相似性的比较变得乱七八糟。...原创 2022-08-13 15:07:53 · 534 阅读 · 0 评论 -
《自然语言处理实战:利用Python理解、分析和生成文本》读书笔记:第3章 词中的数学
TF-IDF是流水线中的第一个阶段,是从文本中提取的最基本的特征集。原创 2022-08-11 22:19:20 · 457 阅读 · 0 评论 -
《自然语言处理实战:利用Python理解、分析和生成文本》读书笔记:第2章 构建自己的词汇表——分词
本章实现了分词功能,并且可以为应用定制分词器。原创 2022-08-11 08:50:35 · 642 阅读 · 0 评论 -
《自然语言处理实战:利用Python理解、分析和生成文本》读书笔记:前言
“能力越大,责任越大。”——伏尔泰?无论把这句话归功于伏尔泰还是本叔叔(Uncle Ben),这句话到今天都依然适用。不过在这个时代,我们或许可以这样说:“数据越多,责任越大。”我们信赖那些拥有数据的公司,希望它们将这些数据用于改善我们的生活。我们允许自己的电子邮件被这些公司扫描以纠正邮件文字中出现的语法错误。这些公司研究我们在社交媒体上的日常生活片段,将其用于向信息流中注入广告。手机和家居能够对我们说的话做出反应,有时在不跟它们说话的时候也会有响应。它们甚至会监控我们的新闻偏好,以迎合我们原创 2021-12-30 17:09:19 · 500 阅读 · 0 评论