![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
kaggle
PythonstartL
这个作者很懒,什么都没留下…
展开
-
关于大数据精准营销中搜狗用户画像挖掘比赛的一些感悟(看第一名代码有感)
1.用NLTK、jieba等对query做一些分词,词形还原,再用doc2vec 得到dbow ,dm的一些特征 2.用tf_idf NB LR NN 等一些方法 再结合stack 融合得到一些新的特征 3. 最后用xgboost 或者LGB 做一些分类。 以上大概可以得到一个baseline,具体怎么做特征工程 怎么调参 还是一个技术活 ...原创 2018-11-17 19:00:31 · 863 阅读 · 0 评论 -
一种经典的自然语言处理数据预处理方式
import sys import os import json import re import numpy as np def PraseRawdata(author = None,constrain = None,src='./chinese-poetry/json/simplified', category="poet.tang"): def sentenceParse(para...原创 2019-03-20 21:57:01 · 1919 阅读 · 0 评论 -
(转)softmax求导写的最清晰最清楚的版本
https://www.jianshu.com/p/6e405cecd609转载 2019-03-22 19:40:26 · 551 阅读 · 0 评论