自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Spark学习笔记:Examples部分(1)-KMeans

最近开始学spark,看了一段时间官网后,从官网上给的github上的examples开始学起。作为自己的一个笔记,有需要的人也可以看一看,反正我是菜鸡。。。也不知道能写几篇,尽力而为吧import sysimport numpy as npfrom pyspark.sql import SparkSessiondef parseVector(line): return np.array([float(x) for x in line.split(' ')])#计算到点p.

2021-05-25 12:30:07 227

原创 Gensim中动态主题模型——dtmmodel的使用

import gensimimport jiebaimport pandas as pdfrom gensim import corpora,modelsfrom gensim.models.wrappers import DtmModelfrom gensim.corpora import Dictionaryfrom collections import defaultdict...

2019-06-02 15:06:55 5277 21

原创 numpy.bincount介绍以及巧妙计算分类结果中每一类预测正确的个数

之前接触到bincount这个函数,简单的以为它就是计算分类结果中每一类的数量,如下:import numpy as npa = np.array([0,1,3,2,1])binc = np.bincount(a)print(binc)结果输出是这样:[1 2 1 1]这个结果表示0有1个,1有两个,2和3各有一个。但是今天又发现了一个不为人知的巧妙用法,是在一篇论...

2019-04-19 11:04:38 1497

原创 爬取百度词条内链接

"""Created on Tue Dec 19 15:23:28 2017@author: Administrator"""import urllib.requestfrom bs4 import BeautifulSoupimport reurl = 'https://baike.baidu.com/item/%E7%BD%91%E7%BB%

2017-12-19 19:51:25 1912

原创 python爬取有道翻译出错 {‘errorcode’:50}

import urllib.requestimport urllib.parseimport jsoncontent = input("Enter the words needs translated:")url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=ugc"data = {}

2017-12-19 14:55:44 22459

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除