自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (21)
  • 收藏
  • 关注

原创 距离度量:欧氏距离,余弦距离,KL散度,马氏距离(含python代码实现)

1. 欧氏距离绝对距离。2. 余弦距离角度。归一化后的欧式距离和余弦距离关系:参考:欧氏距离和余弦相似度的区别是什么?

2020-07-29 14:23:42 14792

原创 pySpark DataFrame上/下采样的方法

方法一:df_class_0 = df_train[df_train['label'] == 0]df_class_1 = df_train[df_train['label'] == 1]df_class_1_over = df_class_1.sample(count_class_0, replace=True)df_test_over = pd.concat([df_class_0, df_class_1_over], axis=0)方法二:train_1= train_initial.w

2020-07-13 21:36:29 5676 1

原创 pySpark Dataframe stddev()和stddev_pop区别

stddev: 返回样本的标准偏差stddev_pop: 返回样本的方差参考:简书

2020-07-13 01:16:09 1834

原创 pySpark repartition和coalesce的区别

搜尋結果網路上的精選摘要In Spark or PySpark repartition is used to increase or decrease the RDD, DataFrame, Dataset partitions whereas the Spark coalesce is used to only decrease the number of partitions in an efficient way.2020年4月12日Spark Repartition() vs Coalesce

2020-07-12 17:57:58 5840

原创 python中的时间戳和time, datetime模块

import timetimestamp = time.time() #1594475666.4027507#转换成localtimetime_local = time.localtime(timestamp)#转换成新的时间格式(2020-07-11 21:54:26)time.strftime("%Y-%m-%d %H:%M:%S",time_local)

2020-07-11 22:02:35 2171

原创 pySpark kill掉集群的任务

连接上集群,执行yarn application -kill application_1511930647873_6100参考:Stack Overflow

2020-07-11 16:26:38 917

原创 pySpark 关于SparkContext和SQLContext等模块

1. pyspark.sql模块是Spark SQL and DataFrames重要的类。pyspark.sql.SparkSession :是DataFrame and SQL 的主入口,比如可以createDataFrame.pyspark.sql.DataFrame :分布式的数据集合。pyspark.sql.Column DataFrame的列.pyspark.sql.Row DataFrame的行.pyspark.sql.GroupedData 聚合方法, 返回 DataFrame

2020-07-10 19:55:36 1565

原创 Linux文件 gz解压

gzip -d test.gz

2020-07-09 20:15:01 407

原创 vim 粘贴慢

在 shell 下:$ :read !pbpaste参考:link

2020-07-08 23:55:18 670

原创 pySpark DataFrame简介

1. 列名类型pyspark.sql.types moduleDataTypeNullTypeStringTypeBinaryTypeBooleanTypeDateTypeTimestampTypeDecimalTypeDoubleTypeFloatTypeByteTypeIntegerTypeLongTypeShortTypeArrayTypeMapTypeStructFieldStructType

2020-07-06 21:03:09 576

原创 LeetCode44. 通配符匹配(python,动态规划) 通用解法

1. 题目给定一个字符串 (s) 和一个字符模式 § ,实现一个支持 ‘?’ 和 ‘*’ 的通配符匹配。‘?’ 可以匹配任何单个字符。‘*’ 可以匹配任意字符串(包括空字符串)。两个字符串完全匹配才算匹配成功。说明:s 可能为空,且只包含从 a-z 的小写字母。p 可能为空,且只包含从 a-z 的小写字母,以及字符 ? 和 *。来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/wildcard-matching著作权归领扣网络所有。

2020-07-05 17:37:03 702

原创 Spark实现xgboost多分类(python)

1. spark-xgboost Java包主要需要xgboost4j-spark-0.90.jar, xgboost4j-0.90.jar, 以及 调用代码 sparkxgb.zip.GitHub上面有xgboost java 实现的包,链接:xgboost;但我省事,用了zhihu xgboost的分布式版本(pyspark)使用测试 的下载链接。注意,xgboost 的版本号 和sparkxgb内的内容对应。2. xgboost多分类我是使用pyspark 运行,通过 pyspark --

2020-07-02 12:56:06 8998 1

原创 LeetCode718. 最长重复子数组(python)

1. 问题给两个整数数组 A 和 B ,返回两个数组中公共的、长度最长的子数组的长度。示例 1:输入:A: [1,2,3,2,1]B: [3,2,1,4,7]输出: 3解释:长度最长的公共子数组是 [3, 2, 1]。说明:1 <= len(A), len(B) <= 10000 <= A[i], B[i] < 100来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/maximum-length-of

2020-07-01 01:14:55 720

python程序设计(浙江大学).rar

python程序设计PPT(浙江大学python课件)对应慕课该课程PPT。 包含9章内容: python语言介绍; 语句; 字符串,列表,元组; 集合,字典; 函数,命名空间和作用域; 文件读写操作; Web应用; 网络爬虫;等

2020-10-22

tennessee-eastman21Faults.rar

TE过程数据 d00.dat ~ d21.dat 以及 d00_te.dat ~ d21_te.dat

2019-06-13

使用AutoEncoder实现语音增强.pptx

使用AutoEncoder实现语音增强.pptx,15页PPT内容;使用AutoEncoder实现语音增强.pptx

2018-12-29

生成对抗网络画猫python

使用对抗神经网络来画猫.pptx; 以及对应的生成对抗网络代码。 使用对抗神经网络来画猫.pptx; 以及对应的生成对抗网络代码。 使用对抗神经网络来画猫.pptx; 以及对应的生成对抗网络代码。

2018-12-25

变分自编码器python代码

generate.py; model.py; train.py; read.py四个代码文件,实现vae。

2018-12-25

深度卷积生成对抗网络TensorFlow代码实现

Tensorflow implementation of [Deep Convolutional Generative Adversarial Networks](http://arxiv.org/abs/1511.06434) which is a stabilize Generative Adversarial Networks.

2018-12-25

深度学习与自然语言处理

2018年发布的,由佐治亚理工学院交互计算学院副教授Jacob Eisenstein编写的深度学习与自然语言处理的教材。 LEARNING;SEQUENCES and TREES;MEANING

2018-12-13

人工智能Nilsson(中文版)

人工智能(中文版 nils nilsson).pdf 人工智能: 英文版- 尼尔森, Nils J. Nilsson

2018-11-26

python qt gui快速编程PyQt编程指南 pdf扫描版及随书源代码源码.zip

PYTHON QT GUI快速编程---PYQT编程指南》,其英文原版书名为:《Rapid GUI Programming with Python and Qt》PDF扫描版; 包括随书源代码。

2018-03-04

Windows直接安装版本redis-3

Windows直接安装版本redis-3.2 64位 下载后解压缩,直接运行安装。

2018-01-30

MySQL编译文件直接下载安装mysqlclient-1.3.7-cp35-none-win_amd64.whl

MySQL编译文件直接下载安装mysqlclient-1.3.7-cp35-none-win_amd64.whl 只使用于python3.5! 其他python需要相应版本的。

2018-01-28

visual studio 黑色主题

visual studio 黑色主题,适用于各个版本,直接导入配置即可。 dark-vision.vssettings

2018-01-25

C程往年试卷2000-2010年

C程往年试卷2000-2010年 ZJU C程往年试卷2000-2010年

2018-01-14

Python for Probability,Statistics,and Machine Learning.pdf

Python for Probability,Statistics,and Machine Learning.pdf Python for Probability,Statistics,and Machine Learning.pdf

2018-01-11

机器学习实战随书代码machine learning in action

机器学习实战随书代码machine learning in action随书代码;CH02-CH15

2017-12-19

TensorFlow_ Large-Scale Machine Learning

TensorFlow_ Large-Scale Machine Learning on Heterogeneous Distributed Systems.pdf )

2017-12-17

数据结构基础期末考试 2005-2012.7z

数据结构基础期末考试 2005-2012 Final Exam of Fundamentals of Data Structures 2012-2013.pdf Final Exam of Fundamentals of Data Structures 2011-2012.pdf etc

2017-12-09

小波变换详解及应用2页PPT

小波变换 在这一章中,我们介绍小波转换。最近几年来,有一种方法被使 用在分解信号方面,而此方法就是小波转换,为什么我们需要这个方 法去分解信号呢?为了去回答这个问题,我们先来看看另一种对分析信 号的标准工具-傅立叶转换(Fourier transform)。

2017-11-27

C++编写的图书馆管理系统

使用C++编写 的图书馆管理系统。 void ViewBook(ook &amp;boo;,lend &amp;Lin;); void ViewCard(ook &amp;boo;,lend &amp;Lin;)等还几个类。

2017-11-22

arduinoTimerOneLibrary_v1.1.0

The library provides two objects — Timer1 and TimerRTC — to manipulate different hardware timers as follows.

2017-11-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除