![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据分析
pandas、numpy常用操作,数据计算
"灼灼其华"
HELLO WORLD,HELLO FUTURE!
展开
-
机器学习(2)Pandas数据读取、选择、定位(loc、iloc、ix)
"""读取csv文件该文本中的分割符既有空格又有制表符(‘/t’),sep参数用‘/s+’,可以匹配任何空格。"""import pandas as pddataset1 = pd.read_csv('C:/Users/62497/Desktop/data1.csv',sep='\s+')# header=None:没有每列的column name,可以自己设定# encoding=...原创 2019-08-28 13:33:06 · 25262 阅读 · 4 评论 -
Python计算余弦相似度及向量范数
目录1、Python求余弦相似度计算两个句子向量2、np.linalg.norm求 向量模长(一范二范)3、python列表转换为矩阵1、Python求余弦相似度在非直角三角形中,余弦定理的公式是:在向量表示的三角形中,假设a向量是(x1, y1),b向量是(x2, y2),那么可以将余弦定理改写成下面的形式:扩展,如果向量a和b不是二维而是n维,上述余弦的计算法仍然正确。假定a和b是两个n维向量,则a与b的夹角 的余弦等于:计算两个句子向量句子A:(..原创 2020-09-08 11:18:58 · 5707 阅读 · 0 评论 -
pandas常用操作总结
# 查找某列数据具体数据df.loc[df['webname'] == '中国货币网']# df.loc[index, column_name],选取指定行和列的数据df.loc[0,'id'] # 'Snow'df.loc[0:2, ['id','title']] # 选取第0行到第2行,id和title列的数据, 注意这里的行选取是包含下标的。df.loc[[2,3],['id','title']] # 选取指定的第2行和第3行,id和title列的数据df.loc[df['webn.原创 2020-08-06 10:23:24 · 2962 阅读 · 0 评论 -
numpy常用总结
pandas中isin()函数及其逆函数使用https://blog.csdn.net/lzw2016/article/details/80472649Numpy中ndim、shape、dtype、astype的用法https://blog.csdn.net/Da_wan/article/details/80518725numpy库np.percentile详解https://blog.csdn.net/brucewong0516/article/details/80205422仅供自己学...原创 2020-06-03 09:27:32 · 201 阅读 · 0 评论 -
numpy.random.randn()&np.random.seed()用法
1、np.random.seed()每次运行代码时设置相同的seed,则每次生成的随机数也相同,如果不设置seed,则每次生成的随机数都会不一样。关于seed()函数用法:seed( ) 用于指定随机数生成时所用算法开始的整数值。1.如果使用相同的seed( )值,则每次生成的随即数都相同;2.如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异...原创 2020-04-10 20:29:47 · 1936 阅读 · 0 评论 -
Numpy(4)数组转置和轴对换,条件逻辑
转置:轴变换:轴: (0,1,2)坐标:(2,3,4)轴0:(1,3,4)斜杠轴1:(2,1,4)×××轴2:(2,3,1)√√√arr = np.arange(24).reshape((2,3,4))arrarray([[[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10...原创 2019-11-08 11:28:20 · 179 阅读 · 0 评论 -
Numpy(3)习题
5、6、9、10、11、12、14、15、16、17、18、20、原创 2019-10-28 17:49:29 · 153 阅读 · 0 评论 -
Numpy(2)I/O(文件读取)、矩阵操作
np.histogram(nd,bins = 5,range=[0,150])# 直方图,统计数据出现的频次# bins代表划分的份数np.save('./data.npy',nd)np.load('./data.npy')np.savetxt('./data.txt',nd)np.loadtxt('./data.txt')基本矩阵操作加减乘除、广播机制nd...原创 2019-10-28 15:24:21 · 167 阅读 · 0 评论 -
Numpy(1)常用操作
Numeric Python是Python的一种开源数值计算扩展,核心是ndarray对象,n维数组一个强大的N维数组对象Array 比较成熟的(广播)函数库 用于整合C/C++和Fortran代码的工具包 实用的线性代数、傅里叶变换和随机数生成函数 numpy和稀疏矩阵运算包是scipy配合使用更加强大https://www.numpy.org.cn/user/创建num...原创 2019-10-27 21:06:03 · 378 阅读 · 0 评论