孙大壮实-CSDN博客

原创模型优化融合

调参 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model import LogisticRegression from sklearn...

2019-04-15 23:08:42 246

原创 lgb

实践在这里插入import pandas as pd from sklearn.model_selection import train_test_split from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model import LogisticRegression from sk...

2019-04-13 15:53:34 1529

原创 LR+SVM

在这import pandas as pd from sklearn.model_selection import train_test_split from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model import LogisticRegression from sklearn ...

2019-04-11 20:54:53 124

原创【数据竞赛】“达观杯”文本智能处理挑战赛3

一、Word2vec原理 (连续词袋模型) CBOW SKip-Gram模型二、word2vec词向量实践 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.feature_extraction.text import TfidfVectorizer import ge...

2019-04-09 18:35:37 1043

原创【数据竞赛】“达观杯”文本智能处理挑战赛2

一.原理 TF-IDF(term frequency=inverse document frequency)是⼀种⽤于资讯检索与文本挖掘的常⽤加权技术。TF-IDF是⼀种统计方法，⽤以评估⼀字词对于⼀个文件集或⼀个语料库中的其中⼀份⽂件的重要程度。字词的重要性随着它在⽂件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常备搜索引擎应⽤，作为文件与用户...

2019-04-07 12:52:08 189

原创【数据竞赛】“达观杯”文本智能处理挑战赛１

一读取数据 import pandas as pd from sklearn.model_selection import train_test_split # 读取数据 df_train = pd.read_csv('./new_data/train_set.csv',index_col='id') test_data = pd.read_csv('./new_data/test_set.c...

2019-04-05 17:16:09 144

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 模型优化融合

原创 lgb

原创 LR+SVM

原创 【数据竞赛】“达观杯”文本智能处理挑战赛3

原创 【数据竞赛】“达观杯”文本智能处理挑战赛2

原创 【数据竞赛】“达观杯”文本智能处理挑战赛１

空空如也

空空如也

原创模型优化融合

原创【数据竞赛】“达观杯”文本智能处理挑战赛3

原创【数据竞赛】“达观杯”文本智能处理挑战赛2

原创【数据竞赛】“达观杯”文本智能处理挑战赛１