python
文章平均质量分 68
不加班程序员
小白一枚
展开
-
pandas中DataFrame的连接操作:join
pandas中的DataFrame变量的join连接总是记不住,在这里做一个小结,参考资料是官方文档。pandas.DataFrame.joinDataFrame.join(other, on=None, how=’left’, lsuffix=”, rsuffix=”, sort=False)通过索引或者指定的列连接两个DataFrame。通过一个list可以一次高效的连接多个DataFrame。参数说明other:【DataFrame,或者带有名字的Series,或者DataFram转载 2020-09-29 15:15:31 · 4275 阅读 · 0 评论 -
【推荐系统】基于用户的协同过滤算法(UserCF)的python实现
1.数据集MovieLensMovieLens数据集包含多个用户对多部电影的评级数据,也包括电影元数据信息和用户属性信息。这个数据集经常用来做推荐系统,机器学习算法的测试数据集。尤其在推荐系统领域.数据集的下载地址为:http://files.grouplens.org/datasets/movielens/,有好几种版本,对应不同数据量,本文所用的数据为ml-latest-small.zip。本文主要使用其中ratings.csv、movies.csv两个数据表:ratings数据userId:转载 2020-09-28 15:37:11 · 1755 阅读 · 0 评论 -
jieba分词算法总结
jieba分词算法总结特点: 支持三种分词模式 –精确模式,试图将句子最精确地切开,适合文本分析; –全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但不能解决歧义; –搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 -支持繁体分词 -支持自定义词典 使用: -安装或者将jieba目录放在当前目录或者site-packages目录 算法: -基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG) -转载 2020-09-27 11:09:27 · 659 阅读 · 0 评论 -
Python日常使用相关操作
d = {'one':5,'two':6,'three':3}sorted(d.items(), key=lambda x:x[1], reverse = True)自定义一个字典d,按照value从大到小排序,如果对key排序,用x[0];默认的是从小到大排序,如果是从大到小,需要用reverse = True.注意返回的是一个List,不再是Dict....原创 2020-09-08 17:32:23 · 171 阅读 · 0 评论 -
sklearn之train_test_split()函数各参数含义
sklearn之train_test_split()函数各参数含义在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 简单用法如下:X_train,X_test, y_train, y_test =sklearn.model_selection.train_test_split(train_data,train_target,test_size=0.4, random_stat转载 2020-08-31 11:53:30 · 837 阅读 · 0 评论 -
Word2Vec参数说明
def __init__(self, sentences=None, corpus_file=None, size=100, alpha=0.025, window=5, min_count=5, max_vocab_size=None, sample=1e-3, seed=1, workers=3, min_alpha=0.0001, sg=0, hs=0, negative=5, ns_exponent=0.75, cbow_mean.原创 2020-07-29 11:00:37 · 2716 阅读 · 0 评论 -
python pip更新到最新版本
python -m pip install --upgrade pip用该命令将pip更新到最新版本。原创 2020-03-09 14:09:54 · 2619 阅读 · 0 评论 -
linux安装pymysql
1. 下载离线安装包:地址为:https://pypi.doubanio.com/simple/pymysql/下载指定版本,这里下载的为PyMySQL-0.7.11.tar.gz2.解压离线包:首先将压缩包放到指定位置,执行解压命令:tar -zxvf PyMySQL-0.7.11.tar.gz3.安装:进入PyMySQL-0.7.11cd PyMySQL-0.7.1...原创 2019-04-16 16:22:47 · 5655 阅读 · 0 评论 -
python 通过国内镜像使用pip安装工具包
国内镜像使用pip原创 2017-08-17 17:37:34 · 656 阅读 · 0 评论 -
通过itchat创建图灵机器人实现微信自动回复
微信自动回复原创 2017-08-03 14:01:57 · 2911 阅读 · 2 评论 -
Centos7 通过yum安装pip
前几天用Python作了一些数据处理,觉得Python在分析数据方面很有优势,于是决定在服务器上用Python做一些测试。Python的一个优点就是有着丰富的库,它们能处理大多数的常见问题,安装这些库也比较简单,通过pip命令就能安装,然后就能直接使用。一般自带的python都为2.7版本。 Pip命令不识别,说明机器上并没有安装pip。 首先安装epel扩展源:sudo yum -y原创 2017-08-16 11:11:58 · 8959 阅读 · 0 评论 -
Word2Vec提取关键词,词语相似度
对于了解深度学习、自然语言处理NLP的读者来说,Word2Vec可以说是家喻户晓的工具,尽管不是每一个人都用到了它,但应该大家都会听说过它——Google出品的高效率的获取词向量的工具。 说到提取关键词,一般会想到TF-IDF和TextRank,大家是否想过,Word2Vec还可以用来提取关键词?而且,用Word2Vec提取关键词,已经初步含有了语义上的理解,而不仅仅是简单的统计了,而且还是无监督原创 2017-08-01 17:06:23 · 7576 阅读 · 1 评论 -
python将dateframe数据存入mysql
import pymysql.cursorsimport pandas as pdconn= pymysql.connect(host='192.168.0.119',port=3306,user='root',passwd='root', db='anjian', chars原创 2017-08-01 15:51:37 · 4086 阅读 · 1 评论