自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 Mac 装机之brew———会放原链接

mac装机之brew

2022-08-02 10:37:24 89

原创 关于python3.x版本 urllib修改过后遇到的几个问题

因为特意在使用python3.x版本,所以在学习爬虫的时候经常会用到一些网上2.x版本的代码,总是报错,就很尴尬。这里列出一些已经遇到的问题,之后在遇到其他的还会有补充。urlopen首先就是urlopen,在2.x版本中,urlopen的使用方法如下:import urllib2url = 'http://www.abc.com'response = urllib2.urlopen(url)而

2017-11-13 16:11:15 607

原创 python3 读中文txt文件提示 'gbk' codec can't decode byte 0x80 ...或 'gbk' codec can't encode character '\xX问题

试了很多次总算是解决了这个问题。一般这个问题是刚开始使用python3处理中文字符时最容易遇到的。 python2 中习惯使用:import sysreload(sys)sys.setdefaultencoding("utf-8")但是在python3 中该段代码可替换为:import sysimport iosys.stdout = io.TextIOWrapper(sys.stdout

2017-09-21 16:06:40 980

原创 Word2Vec + Jieba 分词实现视频标签距离计算

Word2Vec + Jieba 分词实现视频标签距离计算看[Word2vec][1]有一点时间了,不是很理解里面的算法所以决定先亲手实践试试看。分词实现Word2vec学习实现分词实现首先将文章保存成了txt的格式,用python读取txt,并最终将分词结果存入txt文件中。其中还做了一次编码转换。#coding:utf8import jieba# 文字转码 保留片段conv_input

2017-07-25 13:54:50 982

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除