# -*- coding: utf-8 -*-
'''
01 introduction
语言难点:文本不是给计算机阅读的
复杂的语言结构(语法、语义、语用)
歧义(更困难的)
多语言
KDD算法难点
海量(大规模的数据集)
高维
时效性(随时间变化的数据和知识)
噪音数据
挖掘出的模式的可理解性
'''
文本挖掘理论(一)
最新推荐文章于 2024-07-19 06:51:46 发布
# -*- coding: utf-8 -*-
'''
01 introduction
语言难点:文本不是给计算机阅读的
复杂的语言结构(语法、语义、语用)
歧义(更困难的)
多语言
KDD算法难点
海量(大规模的数据集)
高维
时效性(随时间变化的数据和知识)
噪音数据
挖掘出的模式的可理解性
'''