自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 绘图--词云

词云import pandas as pdimport numpy as npimport matplotlib.pylab as pltfrom wordcloud import WordClouddef getExcelData(path_url): """读取表格数据,统计为字典""" data = pd.read_csv(path_url) result = {} for x in data["职位名称"]: if x in result.key

2020-06-17 21:05:03 263

原创 采集数据

数据采集网页采集数据:打开链接(模仿请求头和表单)----->获取分析html-----> 清洗提取信息正则符号含义符号含义.匹配换行符以外的任何字符\转义^匹配字符串的开头$匹配字符串的末尾*匹配前一正则的0+个+匹配前一正则的1+个?匹配前一正则0或1个{m}匹配前一正则m个{m,n}匹配前一正则m-n个[1,9]、[1-9]分别匹配1或9和1-9xpathhtml.fromstring(pat

2020-06-17 19:37:10 308

原创 决策树(离散数据)的python实现

决策树(离散数据)的python实现1.计算熵和信息增益率等,来确定按特征进行分类的顺序2.利用多重字典一层一层建立决策树熵:Ent(D)=−∑pi*log(pi)条件熵:条件熵????(X|Y)相当于联合熵????(????,????)减去单独的熵????(Y),即:????(X|Y)=????(????,????)−????(Y)信息增益率:信息增益/分裂信息度量1.创建特征和分类数据## 矩阵、列表皆可dataSet = [[ 1. , 2.1], [ 2.

2020-06-03 16:55:09 1251

原创 图片和二进制流之间的转化

图片和二进制流之间的转化1.图片—>二进制图像矩阵读取图片,并调节图片像素(如(256,256)).获取像素点的颜色(黑色:RGB(0,0,0))转化二进制流写入文件(黑色:1,其余:0)from PIL import Imageim=Image.open('算法数据/t2.jpg')im = im.resize((256, 256), Image.NEAREST) # 调节图片大小r,g,b = im.split()width,height=im.sizefh=ope

2020-06-01 14:31:36 3116

原创 朴素贝叶斯分类的python实现

贝叶斯分类两组文本(一组属于a类,一组属于b类)NBC(贝叶斯)通过计算样本在各个分类中的概率来进行分类1.相关模块导入import numpy as npimport reimport feedparser as fpimport operator as op2.数据获取def str_strlist(String): ## 字符串——>字符串列表 listOfTokens=re.split(r"\W",String) return [tok.lowe

2020-05-30 16:08:42 346

原创 KNN分类器的python实现

分类器结果:3, 真实结果:3分类器结果:3, 真实结果:2分类器结果:1, 真实结果:1分类器的错误率是0.333333

2020-05-29 21:55:43 2162 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除