机器学习
文章平均质量分 80
HenryXu_wz
这个作者很懒,什么都没留下…
展开
-
语言概率模型和Word2Vec简述
1、 概率语言模型一句话的概率公式:根据一句话中的前文预测下一个词:根据链式概率法则:根据马尔科夫假设,当前词只和前n个词有关系:2. 大名鼎鼎的 n-gram模型为模型想要预测的下一个词,为句子中的历史词语。之后,我们利用极大似然估计优化模型:说起来极大似然很高级,在实现上就是统计各种情况下出现的次数,然后再除以因子来归一化。n-gram的优点:1. 常见的Bigram,Trgram 实现简单,...原创 2018-03-15 16:41:14 · 2135 阅读 · 0 评论 -
lightgbm 错误:ValueError: Unknown label type: 'continuous'
之前在做阿里广告预测比赛,处理了半天,发现在使用 cv 方法验证模型,并使用lightgbm训练时候的发现了一个很奇怪的报错。ValueError: Unknown label type: 'continuous'What ??黑人问号脸??百思不得其解。这是什么意思。百度无果,于是自己分析判断一下。在我把全部数据的"instance_id"去重之后,这个问题消失了。df.drop_duplica...原创 2018-03-20 14:15:27 · 6996 阅读 · 0 评论 -
IJCAI-18 阿里妈妈搜索广告转化预测 (初赛复赛前30名) 总结
1. 比赛背景官网介绍:本次比赛以阿里电商广告为研究对象,提供了淘宝平台的海量真实交易数据,参赛选手通过人工智能技术构建预测模型预估用户的购买意向,即给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1 | query, u...原创 2018-05-15 21:02:14 · 3998 阅读 · 12 评论