Python字典dict{}排序
d = {'one':5,'two':6,'three':3}
sorted(d.items(), key=lambda x:x[1], reverse = True)
自定义一个字典d,按照value从大到小排序,
如果对key排序,用x[0];默认的是从小到大排序,如果是从大到小,需要用reverse = True.
注意返回的是一个List,不再是Dict.
dataframe中某列应用自定义函数
import pandas as pd
import jieba
import jieba.analyse
df = pd.read_csv('d:/data/py/df1.csv', dtype=str)
def get_key_words_(text, num=5):
# noinspection PyBroadException
try:
keyword = jieba.analyse.extract_tags(text, topK=num, allowPOS=['n', 'vn', 'ns', 'nr', 'nrfg', 'v'])
return ' '.join(keyword)
except:
return ''
df['key_words'] = df['content'].apply(get_key_words_)
当自定义函数只有一个参数时,df指定列直接调用apply()方法即可。如果含有多个参数,需要自己指定args,调用方法如下
df['key_words'] = df['content'].apply(get_key_words_,args=(2,))
其中2为自己指定的函数的第二个参数num,参数aegs的格式必须是tuple,所以tuple中只有一个元素时要加,
否则会识别成int。
numpy的ndarray取行和取列值
首先得导包,from numpy import *
如果你要取前几行
a=c[0:3,:] 前0,1,2行
b = c[0,2:4] 第0行的第2和第3列不包括第4列,因为列下标也是从0开始的
d = c[2:4,2:4] 取中间的2-4行的2-4列
e = c[0,:] 取第0行所有数据
f = c[:,1] 取第1列所有数据
g = c[::2,::2] 两个冒号后面表示步长为2