自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

会飞的哼哧的博客

智障儿童一个

  • 博客(29)
  • 资源 (2)
  • 收藏
  • 关注

转载 边缘计算的七项核心技术

边缘计算的七项核心技术作者:施巍松团队(张星洲、王一帆、张庆阳)计算模型的创新带来的是技术的升级换代,而边缘计算的迅速发展也得益于技术的进步。本节总结了推动边缘计算发展的7项核心技术,它们包括网络、隔离技术、体系结构、边缘操作系统、算法执行框架、数据处理平台以及安全和隐私。1、网络边缘计算将计算推至靠近数据源的位置,甚至于将整个计算部署于从数据源到云计算中心的传输路径上的节点,这样的计算部...

2019-12-10 15:05:36 1234 1

转载 sklearn数据集分割方法汇总

一、简介  在现实的机器学习任务中,我们往往是利用搜集到的尽可能多的样本集来输入算法进行训练,以尽可能高的精度为目标,但这里便出现一个问题,一是很多情况下我们不能说搜集到的样本集就能代表真实的全体,其分布也不一定就与真实的全体相同,但是有一点很明确,样本集数量越大则其接近真实全体的可能性也就越大;二是很多算法容易发生过拟合(overfitting),即其过度学习到训练集中一些比较特别的...

2019-09-27 18:59:12 12172 1

原创 Logistic回归实战

基于Logistic回归和Sigmoid函数的分类1、函数公式

2019-09-24 21:17:58 861

原创 pickle模块存储数据

       在机器学习中,我们常常需要把训练好的模型存储起来,这样在进行决策时直接将模型读出,而不需要重新训练模型,这样就大大节约了时间。Python提供的pickle模块就很好地解决了这个问题,它可以序列化对象并保存到磁盘中,并在需要的时候读取出来,任何对象都可以执行序列化操作。Pickle模块中最常用的函数为:(1)pickl...

2019-09-18 19:53:14 241

原创 使用朴素贝叶斯过滤垃圾邮件

本文摘自《机器学习实战》,并对其进行了代码更新与完善。感兴趣者可回复获得资源!准备数据:切分文本现提供邮件文件夹:spam;非垃圾邮件文件夹:ham,各有25封邮件。将邮件中的内容文本,进行分割,转换成一系列词语组成的列表def textParse(bigString): import re listOfTokens=re.split('\W',bigString) #匹配...

2019-09-18 19:24:52 1827 4

原创 使用朴素贝叶斯进行文档分类

本文摘自《机器学习实战》,感兴趣者可回复获得资源!问题描述以在线社区留言板为例,为了不影响社区的发展,现构造一个快速过滤器,用以屏蔽侮辱性言论。准备数据:从文本中构建词向量(1)首先将所有文档中的单词组成词汇表def loadDataSet(): postingList=[['my','dog','has','flea','problems','help','pleas'], ...

2019-09-18 09:36:10 1010

原创 python实现Dijkstra算法--最短路径问题

本文借鉴于张广河教授主编的《数据结构》,对其中的代码进行了完善。从某源点到其余各顶点的最短路径Dijkstra算法可用于求解图中某源点到其余各顶点的最短路径。假设G={V,{E}}是含有n个顶点的有向图,以该图中顶点v为源点,使用Dijkstra算法求顶点v到图中其余各顶点的最短路径的基本思想如下:使用集合S记录已求得最短路径的终点,初始时S={v}。选择一条长度最小的最短路径,该路径的...

2019-09-17 19:45:38 5414 1

原创 python实现堆排序

直接放代码,对堆概念模糊者请自行查询!#python实现堆排序def heapify(arr,n,i): largest=i left=2*i+1 right=2*i+2 if left<n and arr[largest]<arr[left]: largest=left if right<n and arr[large...

2019-09-15 21:59:41 579

原创 python获取决策树的叶节点与深度

本文摘自“机器学习实战”,感兴趣者可自行查看!获取决策树的叶节点现有决策树如下:mytree={'no surfing': {0: 'no', 1: {'flippers': {0: 'no', 1: 'yes'}}}}#获取决策树的叶节点数目def getNumLeaf(myTree): numLeaf=0 firstStr=list(myTree.keys())[0...

2019-09-15 10:42:57 3511

原创 决策树实战

本文摘自“机器学习实战”中案例,在此对其进行了代码更新与简单注释。感兴趣者可回复资源需求!问题描述现有一份海洋生物数据表,如下图所示:不浮出水面是否可以生存是否有脚蹼是否鱼类1是是是2是是是3是否否4否是否5否是否要求:根据表中两个特征“不浮出水面是否可以生存”、“是否有脚蹼”以及标签“是否鱼类”,构造决策树,并预测不浮出水面不可以生存、没有脚蹼的海洋生物是否为鱼类。一般流...

2019-09-14 18:03:35 363

原创 matplotlib绘制图例

本文摘自“莫烦Python”,感兴趣者可自行查看!绘制曲线本文以两条曲线为例,为其绘制图例。import matplotlib.pyplot as pltimport numpy as npx=np.linspace(-3,3,50)y1=2*x+1y2=x**2plt.figure()plt.xlim((-1,2))#设置x坐标轴范围plt.ylim((-2,3))new...

2019-09-13 18:37:28 11251 1

原创 matplotlib基本用法

本文摘自于“莫烦Python”,感兴趣者可自行查看!绘制后的效果图代码import matplotlib.pyplot as pltimport numpy as npx=np.linspace(-3,3,50) #范围是(-3,3),个数是50y1=2*x+1y2=x**2plt.figure() #定义一个图像窗口plt.plot(x,y2) #绘制(x,y2)曲线p...

2019-09-13 17:29:45 151

原创 使用k-近邻算法识别手写数字

本文摘自《机器学习实战》案例,对其进行了代码更新与注释。实战介绍使用k-近邻分类器构造手写识别系统,为了简单起见,系统只识别0-9,需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小:宽高是32像素*32像素的黑白图像。每个图像存于相应的txt文档中,如数字0的图像,存于‘0_x.txt’;数字1的图像,存于‘1_x.txt’中,其中x代表文档在文件夹的位次。需要资源者请回复!!...

2019-09-12 10:58:42 811

原创 k-近邻算法实战

k-近邻 算法实战

2019-09-11 19:58:01 184

原创 python3文件函数相关介绍

File()

2019-09-11 18:15:46 169

原创 MCMC蒙特卡洛算法

python随机数、MCMC蒙特卡洛算法

2019-09-09 15:42:35 511

原创 ndarray数组的创建方法

ndarray数组的创建方法本文参考自中国慕课网中北京理工大学教授讲授的《Python数据分析与展示》。1、从Python中的列表、元祖等类型创建ndarray数组“x=np.array(list/tuple,dtype=? )”当np.array()不指定dtype时,numpy将根据数据情况关联一个dtype类型。import numpy as npx=np.array([0,1,...

2019-07-07 21:53:20 1443

原创 numpy数组排序函数介绍

本文参考自菜鸟教程,另有需求的朋友可自行查询!numpy.sort()函数格式如下:numpy.sort(a, axis, kind, order)参数说明:a:要排序的数组对象axis:排序的轴,axis=0按列排序,axis=1按行排序。如果没有数组会被展开,沿着最后的轴排序。kind:排序的方法,如’quicksort’(快速排序,不稳定)、‘mergesort’(归并排序...

2019-07-05 22:13:02 639

原创 pandas之DataFrame的连接函数join()介绍

pandas.DataFrame.join原文参考于https://www.jianshu.com/p/2358d4013067通过索引或者指定的列连接两个DataFrame。DataFrame.join(other, on=None, how=’left’, lsuffix=”, rsuffix=”, sort=False)参数说明other:【DataFrame,或者带有名字的Se...

2019-07-04 23:56:16 43707 3

转载 DataFrame全部数据的显示输出

本文转自 https://blog.csdn.net/u010591976/article/details/82634522在Anaconda中notebook可以显示全部的数据,但是在pycharm中,使用print(dataframe),不能显示dataframe的全部数据,中间的数据用省略号表示。在pycharm中显示全部数据解决方法,输入下面代码:import pandas as p...

2019-07-04 23:13:53 25268 1

原创 numpy数组(ndarray)属性

numpy数组属性详细信息请查询菜鸟笔记,欢迎转载!NumPy 数组的维数称为秩(rank),一维数组的秩为 1,二维数组的秩为 2,以此类推。NumPy中,每一个线性的数组称为是一个轴(axis),也就是维度(dimensions)。比如说,二维数组相当于是两个一维数组,其中第一个一维数组中每个元素又是一个一维数组。所以一维数组就是 NumPy 中的轴(axis),第一个轴相当于是底层数...

2019-07-04 14:29:32 1952

原创 numpy之ndarray对象介绍

NumPy Ndarray 对象详细信息请于菜鸟教程查询,欢迎转载。N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。ndarray 中的每个元素在内存中都有相同存储大小的区域。创建一个 ndarray 只需调用 NumPy 的 array 函数即可:numpy.array(object,...

2019-07-04 13:50:10 683

转载 pandas库中loc()与iloc()提取数据介绍

本文转载自https://blog.csdn.net/W_weiying/article/details/81411257#commentBoxloc函数:通过行索引 “Index” 中的具体值来取行数据(如取"Index"为"A"的行)iloc函数:通过行号来取行数据(如取第二行的数据)1、利用loc,iloc提取行数据import numpy as npimport pandas a...

2019-07-04 13:20:46 2344

原创 python之format()使用方法

Python语言程序设计基础Python提供了一种输出格式化字符串的函数,即string.format()函数,string是预输出的字符串。format()函数可以通过“{}”和“.”来输出各种格式的字符串。“{}”指定了字符串中使用数据的序号,按照序号用对应的数据替代。示例1:print("{}年,我选择了{}门课程!".format("2019",5))示例2:print("{1...

2019-07-03 11:53:43 408

原创 Python之小数点位数的控制输出

n=34.4567#保留小数点后两位print(round(n,2))print('{:.2f}'.format(n))

2019-07-03 11:18:45 8114

原创 Python中如何将任意含有数字的字符串转化为有效数字

eval()示例说明eval()的功能就是“将任意含有数字的字符串转化为有效数字,以便于计算,待转化的字符串应只包含数字”示例:求语文、数学、英语三门课的平均成绩name=input("请输入姓名:")chinese=eval(input("语文成绩:")) #不用在意数据为整形或浮点型math=eval(input("数学成绩:"))english=eval(input("英语成绩...

2019-07-03 11:13:39 1072

转载 pandas库常用函数介绍

pandas库常用函数本文章转载于 https://blog.csdn.net/u011995719/article/details/72598935Pandas库围绕Series类型和DataFrame类型这两种数据结构,提供了一种高效便捷的数据处理方式。Series类型介绍Series类型是一组数据及与之相关的数据索引组成自动索引:a = pd.Series([9, 8, 7, ...

2019-07-02 18:50:45 1206

原创 基于机器学习的评论情感分析

通过机器学习判定评论的情感倾向,即积极言论或消极言论。涉及四种特征提取方式以及五种分类算法,通过预测准确度的比较,选出最佳特征提取方式、特征维度以及最佳分类算法。

2019-06-14 14:48:59 25022 6

原创 贴吧评论敏感词识别及情感分析初级实现之评论获取

社交网络的发展,贴吧成为网络信息的重要载体。对贴吧评论的敏感词识别及情感分析为网络环境净化以及社会舆情监管提供助力。本文详细介绍了贴吧评论的敏感词识别及情感值分析程序的开发过程,包括贴吧评论的爬虫抓取、评论的敏感词识别以及相应评论的情感分析三个开发模块,主要涉及基于Python的爬虫抓取(requests库的应用)、非关系型数据库MongoDB存储与提取 、确定有穷自动机算法(DFA算法)、卡方统计提取特征、逻辑回归机器学习算法构建模型等技术。

2019-06-12 20:59:11 6558 1

语料库.zip

语料库资源里有网上购酒评论,分为积极评论与消极评论; 资源里还包括中文停用词1800+

2019-06-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除