- 博客(14)
- 资源 (23)
- 收藏
- 关注
原创 【数据平台】pandas将一列中的文本拆分成多行
1、场景:如下图,要将cont中的字符串分割出词汇并单独成一行 2、一列中的文本拆分成多行的效果:3、实现方法:方法一:df=df.drop('cont', axis=1).join(df['cont'].str.split('/', expand=True).stack().reset_index(level=1, drop=True
2017-10-31 17:10:46 5184 1
原创 《推荐系统实践》要点思维导图
推荐系统实践1 好的推荐系统1.1 基本任务:联系用户和物品与分类目录、搜索引擎一样解决信息过载问题。解决无明确目的的物品需求,并能发掘物品长尾。1.2 推荐应用应用于电子商务、视频网站、音乐电台、社交网络、个性化阅读、LBS、个性化邮件、定向广告投放。前端页面、后台日志和推荐算法三功能。1.3 系统评
2017-10-27 18:30:32 2293
原创 【数据平台】python中文分词工具jieba
1、官网:https://pypi.python.org/pypi/jieba/https://github.com/fxsjy/jieba自动安装:pip install jieba 2、特点:支持三种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;搜索
2017-10-26 16:23:14 1079
原创 【正一专栏】《使徒行者2》——难得追完的剧
《使徒行者2》——难得追完的剧 原创 2017-10-25 九天 九天时空追了几天终于把使徒行者2看完了,不记得看使徒行者是啥时候,这些年香港的警匪剧,我唯一跟的也就是使徒行者系列。平常大陆的电视剧基本都是断断续续的看,然后慢慢不看,但是这么多年对于TVB还是一直是很喜欢,从溏心风暴到爱回家,再到使徒行者,都印象深刻。使徒行者2是使徒行者的前传,但是除了卓s
2017-10-26 08:09:31 809
原创 【正一专栏】梅西、内马尔分开明天会更好
梅西、内马尔分开明天会更好 原创 2017-10-20 九天 九天时空虽然对于内马尔离开巴萨一直心存芥蒂,但是看到内马尔离开巴萨后,巴萨依然在联赛和欧冠中表现出强劲的实力,更为重要的是梅西再也不用去照顾内马尔而牺牲自己,我们又看到了那个无所不能、所向披靡的梅西。而内马尔去了大巴黎也是踢得风生水起,成为大巴黎的绝对核心,还有不少漂亮的进球。也许有时候一山真难容二虎,就像内
2017-10-21 08:54:59 795
原创 【数据挖掘笔记六】挖掘频繁模式、关联和相关性:基本概念和方法
6.挖掘频繁模式、关联和相关性:基本概念和方法频繁模式(frequent pattern)是频繁地出现在数据集中的模式。6.1 基本概念频繁模式挖掘搜索给定数据集中反复出现的联系,旨在发现大型事务或关系数据集中项之间有趣的关联或相关性,其典型例子就是购物篮分析。购物篮分析假设全域是商品的集合,每种商品有一个布尔变量,表示该商品是否出现在购物篮中。每个购物篮是一个布尔向量表示,分析布
2017-10-20 09:15:18 3678
原创 计算机领域EI和SCI收录期刊、影响因子及国际会议
1、SCI\EI收录期刊序号刊物名称(以期刊名称的拼音为序)总被引频次影响因子备注1电子学报(英文版、中文版)中文版1676中文版0.450SCI、EI2高技术通讯(英文版、中文版)中文版540中文版0.
2017-10-19 10:00:31 6956
原创 【知识发现】隐语义模型LFM算法python实现(三)
http://blog.csdn.net/fjssharpsword/article/details/78257126基于上篇再优化。1、回顾LFM原理,可以更好地理解代码对于一个给定的用户行为数据集(数据集包含的是所有的user, 所有的item,以及每个user有过行为的item列表),使用LFM对其建模后,可得到如下图所示的模型:(假设数据集中有3个user, 4个item,
2017-10-17 17:04:26 3823 24
原创 【知识发现】隐语义模型LFM算法python实现(二)
http://blog.csdn.net/fjssharpsword/article/details/78015956基于该篇文章中的代码优化,主要是在生成负样例上提高执行速度,代码参考如下:# -*- coding: utf-8 -*-'''Created on 2017年10月16日@author: Administrator'''import numpy as npim
2017-10-17 09:55:56 2568 8
原创 【正一专栏】曼城攻击力惊人露出冠军相
曼城攻击力惊人露出冠军相 2017-10-15 九天九天时空昨晚进行的英超第九轮比赛中,曼联客场0:0艰难逼平利物浦,而卫冕冠军切尔西则是爆冷输给了赛季未赢一场未进一球的水晶宫,阿森纳也是输给了沃特福德,而曼城依旧保持住强大的活力,在主场7:2狂扫了斯托克城,拉开了和曼联的差距,独自在积分榜领跑。近三场英超主场比赛,曼城5:0胜利物浦,5:0又胜水晶宫,加上这场的7:2
2017-10-16 14:38:09 1128
原创 【正一专栏】恒大中超七连冠到手了
恒大中超七连冠到手了 2017-10-14 九天九天时空在昨晚进行的中超赛事中恒大主场艰难4:3战胜了延边富德队,继续保持住4分的领先优势,为赢得中超的7连冠赢了四场关键战役中的首战。这场比赛两队都杀红了眼,恒大要夺冠抢分,延边要保级更要抢分,比赛的进程也是跌宕起伏、上演了一场进球大战。最终恒大以一粒争议的进球获得了最后的胜利,抢到宝贵的3分。而今天下午进行的上港和辽宁
2017-10-16 14:36:42 791
原创 【知识发现】基于物品的协同过滤推荐算法python实现
基于物品的协同过滤算法(Item-Based Collaborative Filtering)是目前业界应用最多的算法,亚马逊、Netflix、Hulu、YouTube都采用该算法作为其基础推荐算法。基于用户的协同过滤算法有一些缺点:随着网站的用户数目越来越大,计算用户兴趣相似度矩阵将越来越困难,其运算时间复杂度和空间复杂度的增长和用户数的增长近似平方关心。并且,基于用户的协同过滤算法很难
2017-10-13 11:02:16 7245 29
原创 【正一专栏】梅西!梅西!梅西!
梅西!梅西!梅西! 2017-10-11 九天九天时空从来都没有想过没有阿根廷和梅西参加的世界杯会是什么样子,但是阿根廷到预选赛最后一轮还不能出线还确实让人有些揪心。在需要梅西像马拉多纳一样站出来的时候,梅西在基多的高原球场用一个漂亮的帽子戏法把阿根廷带入了俄罗斯世界杯,梅西做得比马拉多纳更好。今天这一天全世界都沉浸梅西的世界中,加入到梅吹的行列中,梅西就是救世主、梅西
2017-10-12 09:14:02 834
原创 【正一专栏】阿根廷和葡萄牙都进不了世界杯可能吗?
阿根廷和葡萄牙都进不了世界杯可能吗? 原创 2017-10-10 九天 九天时空世界杯预选赛今晚到明天将要结束各大赛区最后一轮赛事,目前最令人揪心的就是南美区的阿根廷和欧洲区的葡萄牙。葡萄牙还好不管怎样还可以打附加赛,获胜就可以直接出线。阿根廷就比较危险,不赢的话就要告别世界杯了。试想下俄罗斯世界杯没有C罗和梅西,那还是世界杯吗?人口只有33万的冰岛都小组第一出线了
2017-10-11 08:32:41 1031
HMM的java开发库Javajahmm-0.6.1
2017-05-16
EasyPR-JavaCV包
2016-09-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人