自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shiyutianming的博客

IT风口上的猪

  • 博客(33)
  • 收藏
  • 关注

原创 Mac下安装spark,并配置pycharm-pyspark完整教程

最近在学spark,先学习在Mac上安装spark,然后由于本人经常用Python,所以还要配置一下pyspark+pycharm,网上的教程大多不全,现将本人搭建的完整过程分享如下。参考:https://www.cnblogs.com/ostrich-sunshine/p/8414677.htmlhttps://www.jianshu.com/p/31c7f6a5fc7ehttp...

2019-08-21 14:33:13 9412 9

转载 pandas 根据列的值选取所有行

选取等于某些值的行记录 用 ==df.loc[df[‘column_name’] == some_value]选取某列是否是某一类型的数值 用 isindf.loc[df[‘column_name’].isin(some_values)]多种条件的选取 用 &df.loc[(df[‘column’] == some_value) & df[‘other_column...

2019-08-12 14:43:40 320

转载 Pandas的Apply函数理解

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 import pandas as pd import datetime #用来计算日期差的包...

2019-08-06 17:13:43 584

原创 python----最长回文子串的暴力解法以及动态规划解法

https://blog.csdn.net/haoshan4783/article/details/88714499第一种:暴力解法,双重循环,o(n^2)def longestPalindString(ss): palindString="" max_len=0 if len(ss)==1: return ss for i in ra...

2019-08-06 17:11:30 391

转载 python -- lambda表达式

lambda表达式,通常是在需要一个函数,但是又不想费神去命名一个函数的场合下使用,也就是指匿名函数。lambda所表示的匿名函数的内容应该是很简单的,如果复杂的话,干脆就重新定义一个函数了,使用lambda就有点过于执拗了。lambda就是用来定义一个匿名函数的,如果还要给他绑定一个名字的话,就会显得有点画蛇添足,通常是直接使用lambda函数。如下所示:add = lambda ...

2019-08-06 17:03:08 111

转载 pandas中关于set_index和reset_index的用法

1.set_indexDataFrame可以通过set_index方法,可以设置单索引和复合索引。DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)append添加新索引,drop为False,inplace为True时,索引将会还原为列2...

2019-08-06 16:39:22 338

原创 pandas数据显示不完全的问题

利用set_option进行设置# 显示所有列(参数设置为None代表显示所有行,也可以自行设置数字)pd.set_option('display.max_columns',None)# 显示所有行pd.set_option('display.max_rows',None)# 设置数据的显示长度,默认为50pd.set_option('max_colwidth',200)...

2019-08-06 10:43:09 1893

原创 python中pandas读取文件有中文路径怎么办

df1 = pd.read_csv("D:/消费数据/2.csv",'rb') print(df1) 后面加上‘rb’。

2019-08-06 10:38:19 1478

原创 module 'sklearn' has no attribute 'linear_model'

以下导入方式会报错import sklearnmodel = sklearn.linear_model.LinearRegression()修改导入,引用方式,如下所示即可

2019-08-05 17:04:50 3118

转载 使用PolynomialFeatures来进行特征的构造

使用sklearn.preprocessing.PolynomialFeatures来进行特征的构造。它是使用多项式的方法来进行的,如果有a,b两个特征,那么它的2次多项式为(1,a,b,a^2,ab, b^2),这个多项式的形式是使用poly的效果。PolynomialFeatures有三个参数degree:控制多项式的度interaction_only: 默认为False,如果...

2019-07-20 11:02:29 1416

原创 np.unique( )的用法

该函数是去除数组中的重复数字,并进行排序之后输出。

2019-07-12 15:55:54 1319

原创 1021. 删除最外层的括号

有效括号字符串为空 ("")、"(" + A + ")" 或 A + B,其中 A 和 B 都是有效的括号字符串,+ 代表字符串的连接。例如,"","()","(())()" 和 "(()(()))" 都是有效的括号字符串。如果有效字符串 S 非空,且不存在将其拆分为 S = A+B 的方法,我们称其为原语(primitive),其中 A 和 B 都是非空有效括号字符串。给出一个非空有效字...

2019-07-09 17:43:30 125

原创 709. 转换成小写字母-Python

实现函数 ToLowerCase(),该函数接收一个字符串参数 str,并将该字符串中的大写字母转换成小写字母,之后返回新的字符串。示例 1:输入: "Hello"输出: "hello"示例 2:输入: "here"输出: "here"示例 3:输入: "LOVELY"输出: "lovely"python3代码:1、直接使用str的lower()函数...

2019-07-06 16:02:40 156

原创 938. 二叉搜索树的范围和

给定二叉搜索树的根结点 root,返回 L 和 R(含)之间的所有结点的值的和。二叉搜索树保证具有唯一的值。示例 1:输入:root = [10,5,15,3,7,null,18], L = 7, R = 15输出:32示例 2:输入:root = [10,5,15,3,7,13,18,1,null,6], L = 6, R = 10输出:23提示:...

2019-07-05 11:54:43 66

原创 182.查找重负的电子邮箱

编写一个 SQL 查询,查找 Person 表中所有重复的电子邮箱。示例:+----+---------+| Id | Email |+----+---------+| 1 | a@b.com || 2 | c@d.com || 3 | a@b.com |+----+---------+根据以上输入,你的查询应返回以下结果:+---------+| Emai...

2019-07-05 10:03:34 277

转载 复杂网络-4种网络模型

https://www.cnblogs.com/forstudy/archive/2012/03/20/2407954.html一. 规则图  规则图差不多是最没有复杂性的一类图,random_graphs.random_regular_graph(d, n)方法可以生成一个含有n个节点,每个节点有d个邻居节点的规则图。  下面一段示例代码,生成了包含20个节点、每个节点有3个邻...

2019-07-05 09:57:01 2125

转载 tensorflow载入数据的三种方式

转https://blog.csdn.net/lujiandong1/article/details/53376802

2018-04-23 21:22:08 158

原创 python3下使用cv2.imwrite存储图片名含有中文字符的图片

python3中直接用cv2.imwrite方法的话,在图片名中出现乱码,查资料,折腾了好久,发现如下解决方法。代码如下if i % frame_interval == 0: imagename = '{}_{}_{:0>6d}.jpg'.format(video_prefix, filename.split('.')[0], i) imagepath = os.sep.jo...

2018-04-11 15:21:26 11509 3

原创 TensorFlow各种问题整理

1、AttributeError: 'module' object has noattribute 'random_crop'将tf.scalar_summary(loss.op.name,loss)改为tf.summary.scalar(loss.op.name, loss)即可2、AttributeError: 'module' object has no attribute'per_imag...

2018-03-30 16:53:03 3968 2

转载 TensorFlow的reshape操作 tf.reshape

https://www.cnblogs.com/qggg/p/6836238.htmlTF-调整矩阵维度 tf.reshape 介绍函数原型为 def reshape(tensor, shape, name=None)第1个参数为被调整维度的张量。第2个参数为要调整为的形状。返回一个shape形状的新tensor注意shape里最多有一个维度的值可以填写为-1,表示自动计算此维度。很简单的函数,如...

2018-03-30 15:43:17 463

转载 数据库查询模糊匹配

执行数据库查询时,有完整查询和模糊查询之分。一般模糊语句格式如下:SELECT 字段 FROM 表 WHERE 某字段 LIKE 条件;12其中,关于条件,SQL提供了四种匹配模式:一、%:表示零个或多个字符。可以匹配任意类型和任意长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。select * from flow_user where username like '%王%';1...

2018-03-24 16:17:09 837

转载 NLP 深度学习 doc2vec

使用说明 http://www.cnblogs.com/Z-D-/p/6554563.html基于Word2Vec Doc2Vec 进行文本情感分类 http://blog.csdn.net/glory1234work2115/article/details/52454141基于gensim的Doc2Vec简析 http://blog.csdn.net/junjie20082008/article...

2018-03-24 16:16:02 262

转载 Python数据分析 Pandas入门

http://pda.readthedocs.io/en/latest/chp5.html

2018-03-24 16:15:50 147

转载 JAVA 交集,差集,并集

http://blog.csdn.net/benbenkui/article/details/6403383package test;import java.util.HashSet;import java.util.Set;public class Test { public static void main(String[] args) { Set<Integer&g...

2018-03-24 16:15:23 167

转载 Fisher's exact test( 费希尔精确检验)

http://blog.csdn.net/u011467621/article/details/47971909Fisher's exact test[1][2][3] is a statistical significance test used in the analysis ofcontingency tables. Although in practice it is employed w...

2018-03-15 19:58:48 37880 2

转载 关联规则及R语言实现

http://www.dataguru.cn/thread-511355-1-1.html

2018-03-15 19:57:32 484

转载 朴素贝叶斯

http://www.cnblogs.com/marc01in/p/4775440.html引和师弟师妹聊天时经常提及,若有志于从事数据挖掘、机器学习方面的工作,在大学阶段就要把基础知识都带上。机器学习在大数据浪潮中逐渐展示她的魅力,其实《概率论》、《微积分》、《线性代数》、《运筹学》、《信息论》等几门课程算是前置课程,当然要转化为工程应用的话,编程技能也是需要的,而作为信息管理专...

2018-03-15 19:53:41 226

转载 一步步构建卷积神经网络

https://yq.aliyun.com/articles/178374?&utm_campaign=sys&utm_medium=market&utm_source=edm_email&msctype=email&mscareaid=cn&mscsiteid=cn&mscmsgid=2430117083100209225&

2018-03-15 19:53:02 681

转载 Excel/SPSS相关性及显著性水平分析

转载自 http://blog.csdn.net/liyanzhong/article/details/51145381  对两列数据的相关性以及显著性水平的问题一直有困扰,由于对excel的钟情,总是倾向于把数据分析放在excel中进行。本文简单分析excel和SPSS对相关分析和显著性水平的检验应用。(1)方法介绍     Excel中相关性系数可以直接调用CORREL或者Pearson(查看...

2018-03-15 19:48:50 39798

转载 5种常用的相关分析方法

转载自蓝鲸网站分析博客http://bluewhale.cc/2016-06-30/analysis-of-correlation.html5种常用的相关分析方法相关分析(Analysis of Correlation)是网站分析中经常使用的分析方法之一。通过对不同特征或数据间的关系进行分析,发现业务运营中的关键影响及驱动因素。并对业务的发展进行预测。本篇文章将介绍5种常用的分析方法。在开始介绍相...

2018-03-15 19:47:27 42837 1

转载 互信息

https://www.cnblogs.com/gatherstars/p/6004075.html

2018-03-15 19:45:55 363

转载 贝叶斯机器学习路线

https://www.cnblogs.com/bayesianML/p/6377588.html#belief_propagation这是一份贝叶斯机器学习路线图, 正在不断更新中. 路线图由简短的介绍配以相应的学习资源组成, 读者不一定要按顺序学习, 可以直接定位到自己需要的地方. 很多时候, 我们希望自学某个领域的知识, 学习能力是不差的, 但苦于不知该学哪些, 从何学起, 看什么...

2018-03-15 19:44:33 309

转载 核密度估计 Kernel Density Estimation(KDE)

http://blog.csdn.net/unixtch/article/details/78556499

2018-03-15 19:43:20 478

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除