BigData
文章平均质量分 90
Yun_Mengze
这个作者很懒,什么都没留下…
展开
-
Spark学习——RDD操作
RDD操作 创建RDD 两种创建方式 parallelize() 方法 lines = sc.parallelize(["pandas", "i like pandas"]) 外部读取数据创建RDD lines = sc.textFile("/path/to/README.md") RDD操作 转化操作 返回新的RDD ...原创 2018-12-08 15:56:42 · 212 阅读 · 0 评论 -
朴素贝叶斯(手撕代码Python3)
import pandas as pd import random import jieba import jieba.analyse import re from sklearn.model_selection import train_test_split from numpy import * #导入正例负例数据 def load_datas(bid): Pfilename = ...原创 2019-03-13 22:02:11 · 388 阅读 · 0 评论 -
朴素贝叶斯(调包)
import csv import jieba import numpy as np import pandas as pd from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text import TfidfTransformer from sklearn.nai...原创 2019-03-13 22:05:21 · 369 阅读 · 0 评论 -
SVM调包(Python3)
import csv import jieba import numpy as np import pandas as pd from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text import TfidfTransformer from sklearn.svm...原创 2019-03-13 22:09:14 · 1289 阅读 · 0 评论