1、数组中元素的个数 : len(yourList)
创建空数组:list()
2、数组计算
def log(self,num): #取对数
return [math.log(i)for i in num]
def t(self, num):#将二维数组转置
return np.transpose(num)
def pow(self, lists): # 计算平方
return [math.pow(i, 2) for i in lists]
def product(self,A,B):#计算两数相乘
return array(A)*array(B)
def plus(self, A, B): # 数列相加
return array(A) + array(B)
def average(self, A, B): # 取平均值
c = array(self.plus(A, B))
return c / 2
def sub(self,A,B):#数列相减
return array(A)-array(B)
def chu20(self,A):#除以20
A=array(A)
return A/20
def chu16(self,A):#除以16
A=array(A)
return A/16
3、数组的合并输出
a=sm.stats.diagnostic.het_white(fit.resid,exog=fit.model.exog)
name = ['Lagrange multiplier statistic', 'p-value','f-value', 'f p-value']
for n,a in zip(name,a):
print(n,a)
4、从列表中随机选择数据
proxy = random.choice(proxy_list)
5、正则表达式中替换里面的内容关键在于".*?"
text = re.sub(r'<a.*?</a>', "", text)
6、字典数据类型
#将DataFrame转化为字典数据类型,并设置对应索引
userInfo = pd.read_excel('BrowseNumber.xlsx')
userInfo.index = userInfo['userName']
userInfo = userInfo.drop('userName', axis=1)
self.userDist = userInfo.T.to_dict()
#建立一个字典并插入数据
distances={"a":[1,1],
"b":[2,2],
"c":[3,3]
}
distances["d"]=[4,4]
#降序排列
import operator
sortedDistance=sorted(distances.items(),key=operator.itemgetter(1,0),reverse=True)#采用降序排列
#遍历整个字典数据集,键值对
for key,value in self.userDist.items():
distance=self.Euclidean(self.userDist[username],self.userDist[otherUser])#计算相似度
distances[otherUser]=distance
#提取字典的键
lists = list(self.userDist.keys()) # [user_1,.....]
#从字典中删除某键值对
self.userDist[k].pop(str(j))