北京生活
文章平均质量分 79
yrunagate
这个作者很懒,什么都没留下…
展开
-
非結構化數據分析
結構化數據>>數據庫 二維表 非結構化數據>>信息檢索 自由文本最典型 圖片 視頻 音頻 以關鍵字查詢 半結構化數據 文本挖掘的基本流程: 分詞tokenizer 文法處理 把他還原成原始單詞 linguistic modules 每個詞作為一列 變成結構化數據>>表 structured data 數據挖掘 關聯分析 異常點檢測原创 2016-03-15 17:26:36 · 336 阅读 · 0 评论 -
大數據統計建模上課筆記
20160223 一、關於課程 1. 大數據統計建模是一門新課,沒人開過,沒有教科書,也沒有足夠論文形成體系。(論文正在做,還沒發表例如:分佈式的高微計算) 2. 書的形成:研究 → 形成體系 → 形成學科 → 重要內容被提取 → 整理成教科書' 3. 是必修中最後一門課。其他五門都是成熟的課,來自成熟的學科,其他五門沒教到的,剩下的都是這門課。原创 2016-04-18 22:03:16 · 465 阅读 · 0 评论 -
大數據統計建模案例課
20160301 了解方法後 如何用在具體問題中 嘗試從具體問題出發不侷限於案例 基本分析框架下運用新學的知識 結合 抓住問題本質 建模:真實世界 量化 抽出數字概念考慮變量之間的關係 建立模型分析誤差結論 統計在大數據環境下能做的不多, 真實>>變量(計數)>>整合到模型 總結變量間的關係 比直接從經驗更可靠 >>誤差 關於全樣本誤差的議題:雖然目前有原创 2016-04-18 22:14:17 · 1195 阅读 · 0 评论 -
留學資料
http://www.1point3acres.com/bbs/thread-95831-1-1.html 14Fall 非名校本科的统计PhD/部分MS申请经验转载 2016-10-03 14:38:47 · 251 阅读 · 0 评论