数据挖掘
listwebit
这个作者很懒,什么都没留下…
展开
-
交叉熵损失(Cross-entropy)和平方损失(MSE)究竟有何区别?
从数学角度来分析原因原创 2022-05-11 15:11:31 · 291 阅读 · 0 评论 -
用户画像理解
一、用户画像几大模块 结合业务设定指标体系,从常用的用户属性、行为、消费、风险控制这4个维度设定指标体系。 用户画像的存储:标签相关数据的存储,包括Hive存储、MySQL存储、HBase存储和Elasticsearch存储。不同的存储方式适用于不同的场景和业务需要。 标签数据及相关脚本的开发是用户画像构建工作的重点:常见的统计类、规则类、挖掘类、流式计算类标签以及用户特征库等与用户相关的数据的开发,还进一步介绍了如何计算人群数据、打通数据到服务层通路的开发。通过GraphX图计算用户2度关系熟原创 2020-07-02 16:48:13 · 532 阅读 · 0 评论 -
Java开发、网络爬虫、自然语言处理、数据挖掘简介
一、java开发 (1) 应用开发,即Java SE开发,不属于java的优势所在,所以市场占有率很低,前途也不被看好。 (2) web开发,即Java Web开发,主要是基于自有或第三方成熟框架的系统开发,如ssh、springMvc、springside、nutz、,面向各自不同的领域,像OA、金融、教育等有非常成熟案例,这是目前最大的市场所在,故人称“java为web而生”。原创 2017-01-17 15:59:41 · 543 阅读 · 0 评论