![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
非結構化數據分析
文章平均质量分 78
yrunagate
这个作者很懒,什么都没留下…
展开
-
非結構化數據分析三
GMM 高斯混合模型方法 被聚到某類的概率 >>信息量較多假設數據服從高斯混合分布從K個高斯分布生成目標: 求3K個參數 (W係數 MU SIGMA)評價方式:似然函數最高EX原创 2016-04-05 14:20:45 · 274 阅读 · 0 评论 -
非結構化分析二
決策邊界二維分類線性分類器 常用文本分類器都是線性分類器 樸素貝葉思 羅吉回歸 支持向量機 選擇分割面的方式不同非線性分類器並不一定比線性分類器好 貝葉思及其在郵件過濾中的應用垃圾郵件問題傳統的垃圾郵件過濾法 主要有關鍵詞法 特定詞語判斷 校驗碼法 計算文本校驗碼2002 paul graham提出使用貝葉斯推斷過濾垃圾郵件 訓練集越原创 2016-03-22 17:56:03 · 209 阅读 · 0 评论 -
非結構化數據分析
結構化數據>>數據庫 二維表 非結構化數據>>信息檢索 自由文本最典型 圖片 視頻 音頻 以關鍵字查詢半結構化數據文本挖掘的基本流程:分詞tokenizer文法處理 把他還原成原始單詞 linguistic modules每個詞作為一列 變成結構化數據>>表 structured data 數據挖掘 關聯分析 異常點檢測原创 2016-03-15 17:26:36 · 330 阅读 · 0 评论