自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。...

原创 达观杯比赛复盘专题

达观杯 比赛简介 特征工程 1.构建特征 countvectororizer TfidfVectorizer Doc2Vec HashingVectorizer length 降维lsa 和 lda SelectFromModel 2.组合特征 tfidf(word+article) tfi...

2018-09-30 17:22:38

阅读数 1157

评论数 2

原创 组合特征(五)countvector(w)+doc(w)+hash(w)

""" 将countvector(word)、hash(word)和doc2vec(word)拼接成新特征 "&...

2018-09-30 17:14:03

阅读数 334

评论数 0

原创 组合特征(四)linearsvm-tfidf(word)+lr-tfidf(article)

""" 将linearsvm挑选的tfidf(word)特征和lr挑选的tfidf(article) """ import pickle from scipy import sparse from scipy.sparse impor...

2018-09-30 17:12:45

阅读数 621

评论数 0

原创 组合特征(三)tfidf(word+article+length)

''' 特征拼接,拼接文章长度 #1.载入特征 #2 读文章长度 #3 特征缩放,拼接特征 ''' import pickle # 载入特征 with open('tfidf(word+article).pkl',...

2018-09-30 17:12:07

阅读数 247

评论数 0

原创 组合特征(二)tfidf(word+article)+lsa

""" 将tfidf(word+article)特征降维为lsa特征,并将结果保存至本地,并将结果保存到本地 """ from sklearn.decomposition import TruncatedSVD import pickl...

2018-09-30 17:11:11

阅读数 441

评论数 0

原创 组合特征(一)tfidf(word+article)

""" 将tfidf(word)和tfidf(article)拼接成新的特征 """ import pickle import pandas as pd from sklearn.feature_extraction.text imp...

2018-09-30 17:10:05

阅读数 623

评论数 0

原创 达观杯_分类融合

import os from collections import Counter def read_dir_by_filter(root_dir,filter): file_list = [] for root,dirs,files in os.walk(root_dir): ...

2018-09-29 16:29:38

阅读数 754

评论数 0

原创 达观杯_概率融合

#import pickle import pandas as pd import numpy as np import time path='D:/daguanbei/data/proba' print('1 读取概率+投票') svm_1 = pd...

2018-09-29 16:28:21

阅读数 556

评论数 0

原创 达观杯_构建模型(四)贝叶斯

""" 1.特征:linearsvm-tfidf(word)+lr-tfidf(article) / doc2vec_word 2.模型:bayes """ from sklearn.ca...

2018-09-24 10:57:41

阅读数 385

评论数 0

原创 达观杯_构建模型(三)lightGBM

countvector(a)+doc(a)+hash(a) """ 1.特征:countvector(a)+doc(a)+hash(a) 2.模型:lgb """ import numpy as np import pandas as p...

2018-09-23 19:35:02

阅读数 558

评论数 0

原创 达观杯_构建模型(二)逻辑回归

特征:tfidf(word+article) """ 1.特征:tfidf(word+article) 2.模型:lr 3.参数:C=120 """ import pandas as pd import pickle from skle...

2018-09-23 19:32:54

阅读数 839

评论数 0

原创 达观杯_构建模型(一)linearSVM

特征:tfidf(word)+tfidf(article) """ 1.特征:tfidf(word)+tfidf(article) 2.模型:linearsvm 3.参数:C=5 """ from sklearn.svm import ...

2018-09-23 19:30:44

阅读数 791

评论数 0

原创 特征工程(七)SelectFromModel

linearsvm """ 用linearsvm从tfidf(word)中挑选特征,并将结果保存到本地 tfidf(article)可做类似处理 """ import time import pickle from sklearn....

2018-09-23 19:26:45

阅读数 1801

评论数 0

原创 特征工程(六)lsa和lda

lsa """ 将tfidf(word)特征降维为lsa特征,并将结果保存至本地,并将结果保存到本地 tfidf(article)可做类似处理 ""&amp...

2018-09-23 19:24:11

阅读数 586

评论数 0

原创 特征工程(五)length

''' 将原始数据的word的长度特征,并将结果保存到本地 article特征可做类似处理 ''' df_train=pd.read_csv('train_set.csv') df_test=pd.read_csv...

2018-09-23 19:21:11

阅读数 271

评论数 0

原创 特征工程(四)HashingVectorizer

''' 将原始数据的word特征数字化为hash特征,并将结果保存到本地 article特征可做类似处理 ''' import pandas as pd from sklearn.feature_extraction.text imp...

2018-09-23 19:19:46

阅读数 1347

评论数 0

原创 特征工程(三)Doc2Vec

''' 将原始数据的word特征数字化为doc2vec特征,并将结果保存到本地 article特征可做类似处理 ''' import pandas as pd import numpy as np from gensim.models...

2018-09-23 19:18:59

阅读数 727

评论数 0

原创 特征工程(二)TfidfVectorizer

''' 将原始数据的word特征数字化为tfidf特征,并将结果保存到本地 article特征可做类似处理 ''' import pandas as pd from sklearn.feature_extraction.text i...

2018-09-23 19:16:55

阅读数 1048

评论数 0

原创 特征工程(一)countvectororizer

''' 将原始数据的word特征数字化为countvector特征,并将结果保存到本地 article特征可做类似处理 ''' import pandas as pd from sklearn.feature_extraction.t...

2018-09-23 19:13:00

阅读数 1610

评论数 0

翻译 LaTex公式编辑方法

公式排版 行内公式 ∑i=0ni2\sum_{i=0}^{n}i^2∑i=0n​i2 $\sum_{i=0}^{n}i^2$ 独立公式 E=mc2E=mc^2E=mc2 $$E=mc^2$$ 注:# $ % ^ & ~ \ { } 这些字符有特殊意义,在表示时,需要转义...

2018-09-20 20:24:55

阅读数 1370

评论数 0

原创 剑指offer_第20题_包含min函数的栈_Python

题目描述 定义栈的数据结构 并在该类型中实现一个能够得到栈中所含最小元素的min函数。时间复杂度应为O(1) 理解 什么是栈 算法复杂度 解题思路 思路1 class Solution: def __init__(self): self.stack ...

2018-09-12 17:40:40

阅读数 431

评论数 0

原创 剑指offer_第19题_顺时针打印矩阵_Python

题目描述 输入一个矩阵 按照从外向里以顺时针的顺序依次打印出每一个数字 例如,如果输入如下4 X 4矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10. ...

2018-09-12 11:45:27

阅读数 280

评论数 0

原创 达观杯_比赛简介

比赛内容 此次比赛,达观数据提供了一批长文本数据和分类信息,希望选手动用自己的智慧,结合当下最先进的NLP和人工智能技术,深入分析文本内在结构和语义信息,构建文本分类模型,实现精准分类。 评分规则 评分算法 binary-classification 评分标准 采用各个品类F1指标的算...

2018-09-11 23:22:29

阅读数 1291

评论数 0

原创 剑指offer_第18题_二叉树的镜像_Python

题目描述 将给定的二叉树,变换为其镜像 解题思路 思路1 递归 class Solution: # 返回镜像树的根节点 def Mirror(self, root): if root: root.left,root.righ...

2018-09-11 21:33:31

阅读数 350

评论数 0

原创 剑指offer_第17题_树的子结构_Python

题目描述 输入两棵二叉树A,B 判断B是不是A的子结构。 其中空树不是任意一个树的子结构 class TreeNode: def __init__(self, x): self.val = x self.left = None sel...

2018-09-11 18:29:49

阅读数 341

评论数 0

原创 剑指offer_第16题_合并两个排序的链表_Python

题目描述 输入两个单调递增的链表 输出两个链表合成后的链表 合成后的链表满足单调不减规则 解题思路 思路1 递归 def Merge(self, pHead1, pHead2): merge = None if pHead1 == None...

2018-09-11 16:13:43

阅读数 203

评论数 0

原创 剑指offer_第15题_反转链表_Python

题目描述 输入一个链表,反转链表后,输出新链表的表头。 理解 怎么反转? 我要找到每个结点 改变每个结点的next

2018-09-09 23:04:29

阅读数 456

评论数 0

提示
确定要删除当前文章?
取消 删除