比鲁斯萨玛
码龄8年
关注
提问 私信
  • 博客:31,917
    31,917
    总访问量
  • 5
    原创
  • 993,087
    排名
  • 8
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:美国
  • 加入CSDN时间: 2017-04-16
博客简介:

weixin_38341450的博客

查看详细资料
个人成就
  • 获得71次点赞
  • 内容获得21次评论
  • 获得61次收藏
创作历程
  • 1篇
    2021年
  • 2篇
    2019年
  • 2篇
    2017年
成就勋章
TA的专栏
  • Spark学习笔记
    1篇
  • LearingFromSyntheticData
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Spark学习笔记:Examples部分(1)-KMeans

最近开始学spark,看了一段时间官网后,从官网上给的github上的examples开始学起。作为自己的一个笔记,有需要的人也可以看一看,反正我是菜鸡。。。也不知道能写几篇,尽力而为吧import sysimport numpy as npfrom pyspark.sql import SparkSessiondef parseVector(line): return np.array([float(x) for x in line.split(' ')])#计算到点p.
原创
发布博客 2021.05.25 ·
274 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Gensim中动态主题模型——dtmmodel的使用

import gensimimport jiebaimport pandas as pdfrom gensim import corpora,modelsfrom gensim.models.wrappers import DtmModelfrom gensim.corpora import Dictionaryfrom collections import defaultdict...
原创
发布博客 2019.06.02 ·
5506 阅读 ·
2 点赞 ·
21 评论 ·
45 收藏

numpy.bincount介绍以及巧妙计算分类结果中每一类预测正确的个数

之前接触到bincount这个函数,简单的以为它就是计算分类结果中每一类的数量,如下:import numpy as npa = np.array([0,1,3,2,1])binc = np.bincount(a)print(binc)结果输出是这样:[1 2 1 1]这个结果表示0有1个,1有两个,2和3各有一个。但是今天又发现了一个不为人知的巧妙用法,是在一篇论...
原创
发布博客 2019.04.19 ·
1587 阅读 ·
2 点赞 ·
0 评论 ·
7 收藏

爬取百度词条内链接

"""Created on Tue Dec 19 15:23:28 2017@author: Administrator"""import urllib.requestfrom bs4 import BeautifulSoupimport reurl = 'https://baike.baidu.com/item/%E7%BD%91%E7%BB%
原创
发布博客 2017.12.19 ·
1942 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

python爬取有道翻译出错 {‘errorcode’:50}

import urllib.requestimport urllib.parseimport jsoncontent = input("Enter the words needs translated:")url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=ugc"data = {}
原创
发布博客 2017.12.19 ·
22520 阅读 ·
64 点赞 ·
0 评论 ·
15 收藏