Python
文章平均质量分 64
iseeyounow2017
当你什么都改变不了时,只有努力的改变自己,才能更好的生活!!!
展开
-
python进行简单的文本相似度分析
python进行简单的文本相似度分析本文利用gensim包、jieba包和TF-IDF模型进行简单的文本相似度分析。从而能够让我们确定,哪句话和哪句话相似程度是多少。文本相似度分析是自然语言处理中常用的一种分析方法,也是一个重要的分析方法。TF-IDFM模型1.模型的原理:是一个语料另一种表示;是一种语料的词权重表示,是词的一种加重技术;是一套自定义的计算模型方法。2.直观的核心思想是:字...原创 2020-04-30 14:54:23 · 1026 阅读 · 3 评论 -
转载!python 中 Numpy包
Numpy是Python的一个能快速处理矩阵运算的数学库,如果你从事的是数据科学,或者机器学习领域的话,Numpy是一项最基本的技能。他不仅简化了我们在处理矩阵运算时需要编写的代码,而且,许多Numpy的底层函数用C编写,我们能获得在用普通Python自带的列表结构时,所无法达到的运算速度。下面,我将就Numpy的一些基本用法,做个简单的介绍,当然,一来Numpy库本身会不断更新,二来,我本人的认知转载 2017-11-07 18:47:36 · 719 阅读 · 0 评论 -
利用Python,获取Excel某列中(该列中每个单元格既有中文又有数字)的数字!!!!
利用Python,获取Excel某列中(该列中每个单元格既有中文又有数字)的数字!!!!先看一下原始数据,如下图:我们要处理后的目标数据,如下图:使用正则表达式来解决此问题 正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。 正则表达式的常用的字符含义通过一下代码原创 2017-11-15 20:20:09 · 13266 阅读 · 2 评论 -
python 触发器!利用触发器定时执行某项任务!
首先介绍一下需要的模块time模块是与时间相关的模块,该模块提供了time,clock,sleep之类的脚本函数(或者叫做方法)。在Python中,通常有这几种方式来表示时间:1、时间戳(timestamp)。通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回的是float类型。返回时间戳方式的函数主要有time()原创 2017-11-22 19:19:31 · 12732 阅读 · 1 评论 -
python 合并Excel中已有的N个sheet,并且把合并后的数据保存为新的sheet
python 合并Excel中已有的N个sheet,并且把合并后的数据保存为新的sheet之前想把一个工作簿中结构相同的多个sheet进行合并,由于sheet太多,不可能手动完成,又不会VBA编程,所以就谢了一个实现此功能的python程序。希望对有相同需求的兄弟姐妹有帮助。用到的Python模块如下:xlrdpandasopenpyxlxlrd、pandas、op...原创 2018-08-17 18:08:39 · 21443 阅读 · 8 评论 -
转载!! XGBoost Python实战
一. 前言在XGBoost基本原理博文中我们介绍了XGBoost的基本原理,本篇博文我们将介绍XGBoost的基本使用方法,作为新手的学习参考。本文使用kaggle上的泰坦尼克数据集,只是对XGBoost的使用做一个简单的描述,若想知道Kaggle的整个竞赛流程以及在竞赛中如何使用XGBoost进行预测的话,关注本博客,以后会陆续推出与竞赛内容相关的博客及代码。kaggle的泰坦尼克的数...转载 2019-05-09 18:39:19 · 961 阅读 · 0 评论 -
转 网格搜索GridSearchCV参数详细解析
一网格搜索(寻求参数最优的一种方法)首先为想要调参的参数设定一组候选值,然后网格搜索会穷举各种参数组合,根据设定的评分机制找到最好的那一组设置。使用:from sklearn.model_selection import GridSearchCVclass sklearn.model_selection.GridSearchCV(estimator, param_grid...转载 2019-06-27 17:38:16 · 745 阅读 · 0 评论 -
推荐算法--python实现基于用户的协同过滤算法
1.什么是协同过滤?举个例子,有一天,你想去看电影了,但你不知道有什么电影好看,然后你可能就会问问你的朋友们,看看有什么好看的电影推荐,这时候大部分人都会倾向于问跟你有品味差不多的人。而这也就是协同过滤的核心思想。协同过滤推荐分为三种类型。第一种是基于用户(user-based)的协同过滤,第二种是基于项目(item-based)的协同过滤,第三种是基于模型(model based)的协同过滤...原创 2019-09-17 15:49:31 · 3854 阅读 · 2 评论