python
伽音
数据挖掘、机器学习、深度学习、自然语言处理
展开
-
python 时间处理
datetime模块包含一下四个类:datetime.time:时间类,只包含时、分、秒、微秒等时间信息。datetime.date:日期类,只包含年、月、日、星期等日期信息。datetime.datetime:日期时间类,包含以上两者的全部信息。datetime.timedelta:时间日期差值类,用来表示两个datetime之间的差值。1.字符串更改timeStr = "2018-06-01 ...原创 2018-06-29 18:36:49 · 191 阅读 · 0 评论 -
python numpy
numpy是Python的一个矩阵类型,提供了大量矩阵处理的函数。它的内部是通过c语言实现的而非Python,包含了两种基本的数据类型:数组和矩阵。import numpy as nps = np.matrix([[6, 7, 3], [3, 1, 5], [4, 7, 2]])print(s) # 输出矩阵print(s.dtype) # 矩阵元素类型print(...原创 2018-07-07 15:31:37 · 423 阅读 · 0 评论 -
python pandas
import numpy as npimport pandas as pddf = pd.DataFrame({'a': [1, 4, 2, 3, 3, 2, 3, 1], 'b': [4, 3, 2, 1, 1, 3, 4, 1], 'c': [2, 3, 1, 2, 4, 2, 4, 2]})print(df...原创 2018-07-23 21:18:05 · 212 阅读 · 0 评论 -
python matplotlib
import matplotlib.pyplot as plt# 设置中文字体plt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axes.unicode_minus'] = False# 样例图plt.title('我的第一个图', fontsize=20) # 标题plt.xlabel('X轴', color='...原创 2018-08-20 09:31:25 · 213 阅读 · 0 评论 -
python 余弦相似度
from sklearn.metrics.pairwise import cosine_similaritya = [[1, 3, 2], [2, 2, 1]]print(cosine_similarity(a))原创 2018-09-04 15:55:18 · 10936 阅读 · 0 评论 -
python 皮尔逊相关系数
from scipy.stats import pearsonrx = [0.5, 0.4, 0.6, 0.3, 0.6, 0.2, 0.7, 0.5]y = [0.6, 0.4, 0.4, 0.3, 0.7, 0.2, 0.5, 0.6]print(pearsonr(x, y))# 输出:(r, p)# r:相关系数[-1,1]之间# p:p值越小 ...原创 2018-09-04 15:56:07 · 10786 阅读 · 1 评论 -
python 数据预处理
1.缺失值填充import numpy as npimport pandas as pddf = pd.DataFrame({'a': [3, 1, 3, 2, 4, 3, 2, 4, 3], 'b': [4, 6, np.nan, 6, 2, 7, np.nan, 3, 5], 'c': [np.nan, 8...原创 2018-09-04 15:56:40 · 276 阅读 · 0 评论