- 博客(20)
- 资源 (14)
- 收藏
- 关注
原创 幂函数规律总结
1.第一象限内图象类型之规律(如图1):1.n>1时,过(0,0)、(1,1)抛物线型,下凸递增。2.n=1时,过(0,0)、(1,1)的射线。 3.0<n<1时,过(0,0)、(1,1)抛物线型,上凸递增。4.n=O时,变形为y=1(x≠0),平行于x轴的射线。 5.n<0时过(1,1),双曲线型,递减,与两坐标轴的正半轴无限接近。2.第一象限内图象走向之规律(如图1):x≥1部分各种幂函
2016-12-29 16:45:59 27198
原创 python学习网址以及笔记
python学习网址 点击打开链接 http://www.runoob.com/python/python-dictionary.html主要内容有Python 基础教程Python 基础教程Python 简介Python 环境搭建Python 中文编码Python 基础语法Python 变量类型Python 运算符Python 条件语句
2016-12-29 16:21:19 2034
转载 Python 字典(Dictionary)数据处理
Python 字典(Dictionary)字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格式如下所示:d = {key1 : value1, key2 : value2 }键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,
2016-12-29 16:19:24 4990
转载 Python 列表(List)处理
Python 列表(List)序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。Python有6个序列的内置类型,但最常见的是列表和元组。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。列表是最常用
2016-12-29 16:17:56 2049
转载 Python 字符串处理
Python 字符串字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串。创建字符串很简单,只要为变量分配一个值即可。例如:var1 = 'Hello World!'var2 = "Python Runoob"Python访问字符串中的值Python不支持单字符类型,单字符也在Python也是作为一个字符串使用。Pyt
2016-12-29 16:16:56 308
原创 匹配一句话中的数字并提取出来
import reeachline='田荣昌先生质押给齐商银行股份有限公司滨州无棣支行的本公司共计3,080,000股有限售条件股于2016年11月9日解除质押'if re.search(r'(.*?)(\d+[,.\d]+股)(.*?)$',eachline) : acount = re.search(r'(.*?)(\d+[,.\d]+股)(.*?)$',eachline).grou
2016-12-27 17:44:55 1862
原创 Python 程序中遇到 'float' object has no attribute '__getitem__'
是误将float当作list或者tuple来操作了,对于list或者元组,[]操作是访问下标所在的元素,也就是__getitem__方法。由于python定义变量的时候并不说明类型,类型都在运行时确定,因此有出现类型错误的可能性。
2016-12-27 16:11:17 79111 1
原创 PCA学习笔记 python实现
PCA步骤:1、去除平均值2、计算协方差矩阵3、计算协方差矩阵的特征值和特征向量4、将特征值从大到小排序5、保留最上面的N个特征向量6、将数据转换到上述N个特征向量构建的新空间中方法1:scikit-learn中的主成分分析(PCA)的使用1、函数原型及参数说明class sklearn.decomposition.PCA(n
2016-12-19 16:44:22 2489 2
转载 根据数据的类型选择机器学习算法(面试)
考虑到机器学习有这么多算法,给定一个数据集,你如何决定使用哪一个算法?答:你应该说,机器学习算法的选择完全取决于数据的类型。如果给定的一个数据集是线性的,线性回归是最好的选择。如果数据是图像或者音频,那么神经网络可以构建一个稳健的模型。如果该数据是非线性互相作用的的,可以用boosting或bagging算法。如果业务需求是要构建一个可以部署的模型,我们可以用回归或决策树模型(
2016-12-19 10:26:38 780
转载 先验概率、似然函数与后验概率
先验概率、似然函数与后验概率先验概率Prior probability 在贝叶斯统计中,先验概率分布,即关于某个变量 p 的概率分布,是在获得某些信息或者依据前,对 p 的不确定性进行猜测。例如, p 可以是抢火车票开始时,抢到某一车次的概率。这是对不确定性(而不是随机性)赋予一个量化的数值的表征,这个量化数值可以是一个参数,或者是一个潜在的变量
2016-12-19 09:46:52 733 1
转载 python数据类型详解(自己需要的时候看看)
python数据类型详解目录1、字符串2、布尔类型3、整数4、浮点数5、数字6、列表7、元组8、字典9、日期1、字符串1.1、如何在Python中使用字符串a、使用单引号(')用单引号括起来表示字符串,例如:str='this is string';print str;b、使用双引号(")双引号中的字符串与单引号中的字符串
2016-12-08 09:04:52 487
转载 python 中NumPy和Pandas工具包中的函数使用笔记(方便自己查找)
二、常用库1.NumPy NumPy是高性能科学计算和数据分析的基础包。部分功能如下:ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。用于对整组数据进行快速运算的标准数学函数(无需编写循环)。用于读写磁盘数据的工具以及用于操作内存映射文件的工具。线性代数、随机数生成以及傅里叶变换功能。用于集成C、C++、Fortran等语言编写的代码的工具。
2016-12-07 11:11:33 16358 1
原创 item-based CF 推荐系统学习笔记
基于物品的协同过滤不是利用物品的内容计算属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。比如喜欢a的大多数也喜欢B,那么将推荐给已经拥有物品a的用户。
2016-12-06 17:30:58 1508
原创 推荐系统研究常用数据库
推荐系统学术研究常用的数据集包括:MovieLens,MovieLens数据集中,用户对自己看过的电影进行评分,分值为1~5。MovieLens包括两个不同大小的库,适用于不同规模的算法。小规模的库是943个独立用户对1 682部电影作的10 000次评分的数据;大规模的库是6 040个独立用户对3 900部电影作的大约100万次评分。EachMovie,HP/Compaq的DEC研究中心
2016-12-05 17:30:30 4722
原创 用户活跃度和物品流行度的分布
这用户活跃度和物品流行度的两种分布都属于长尾分布,类似下图。横坐标时流行度,纵坐标是对应流行度的物品以及用户总数。(这里求了对数,所以基本成正比)长尾分布:f(x)=a X^k(指数分布)
2016-12-05 17:23:51 2907
转载 相似性度量选择篇:判断选择哪种相似性作为度量合适
需要结合你的数据进行评估,看看哪种相似性度量方式最适合你的数据集。常用的方法就是把数据集分成两份,一份作为训练数据,一份作为测试数据,然后在训练数据上使用本文中讲到的相似性度量方式分别计算结果,去和实际的测试数据进行比较,看效果来决定选择哪一种。
2016-12-02 10:32:27 2099
转载 相似度度量2:皮尔森相关系数和斯皮尔曼相关性
1)皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。皮尔森相关系数反应了两个变量之间的线性相关程度,它的取值在[-1, 1]之间。当两个变量的线性关系增强时,相关系数趋于1或-1;当一个变量增大,另一个变量也增大时,表明它们之间是正相关的,相关系数大于0;如果一个变量增大,另一个变量却减小,表明它们之间是负相关的,相关系数小于0;如果相关系数等于0,表明它们之间不存在线性相关关系。
2016-12-02 10:32:00 9780
转载 相似度度量1:欧式距离和余弦相似度的联系与区别
根据欧氏距离和余弦相似度各自的计算方式和衡量特征,分别适用于不同的数据分析模型:欧氏距离能够体现个体数值特征的绝对差异,所以更多的用于需要从维度的数值大小中体现差异的分析,如使用用户行为指标分析用户价值的相似度或差异;而余弦相似度更多的是从方向上区分差异,而对绝对的数值不敏感,更多的用于使用用户对内容评分来区分用户兴趣的相似度和差异,同时修正了用户间可能存在的度量标准不统一的问题(因为余弦相似度对
2016-12-02 10:31:27 1435 1
原创 mahout学习过程中遇到java @Override问题
import org.apache.mahout.cf.taste.common.TasteException;import org.apache.mahout.cf.taste.eval.DataModelBuilder;import org.apache.mahout.cf.taste.eval.RecommenderBuilder;import org.apache.mahout.cf
2016-12-01 16:11:19 490
原创 CentOS 64位系统环境下Hadoop2.6伪分布式安装笔记
按照网上大多说博客安装都失败了,特此总结。hadoop下载:http://mirror.bit.edu.cn/apache/hadoop/common/;http://mirrors.cnnic.cn/apache/hadoop/common/ 在安装 Hadoop 前还需要做一些必备工作。1、首先以 root 用户登录,接着执行命令创建新用户 hadoop:useradd -
2016-12-01 14:14:57 370
IMDB电影评分正负数据集(3个版本的imdb_full.pkl,imdb.pkl以及imdb.npz)
2018-01-19
tensorFlow-GPU版本 安装时用到的cuDNN5.1版本
2017-11-10
国际学术会议poster模板(5个)
2017-11-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人