Python日常使用相关操作

最新推荐文章于 2024-07-19 07:51:17 发布

不加班程序员

最新推荐文章于 2024-07-19 07:51:17 发布

阅读量194

点赞数

分类专栏： python 文章标签： python 数据结构

本文链接：https://blog.csdn.net/SuperBoy_Liang/article/details/108473367

版权

python 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

Python字典dict{}排序

d = {'one':5,'two':6,'three':3}
sorted(d.items(), key=lambda x:x[1], reverse = True)

自定义一个字典d,按照value从大到小排序，

如果对key排序,用x[0];默认的是从小到大排序,如果是从大到小,需要用reverse = True.

注意返回的是一个List,不再是Dict.

dataframe中某列应用自定义函数

import pandas as pd
import jieba
import jieba.analyse


df = pd.read_csv('d:/data/py/df1.csv', dtype=str)

def get_key_words_(text, num=5):
    # noinspection PyBroadException
    try:
        keyword = jieba.analyse.extract_tags(text, topK=num, allowPOS=['n', 'vn', 'ns', 'nr', 'nrfg', 'v'])
        return ' '.join(keyword)
    except:
        return ''


df['key_words'] = df['content'].apply(get_key_words_)

当自定义函数只有一个参数时，df指定列直接调用apply()方法即可。如果含有多个参数，需要自己指定args，调用方法如下

df['key_words'] = df['content'].apply(get_key_words_,args=(2,))

其中2为自己指定的函数的第二个参数num，参数aegs的格式必须是tuple，所以tuple中只有一个元素时要加，

否则会识别成int。

numpy的ndarray取行和取列值

首先得导包，from numpy import *

如果你要取前几行

a=c[0:3,:] 前0,1,2行

b = c[0,2:4] 第0行的第2和第3列不包括第4列，因为列下标也是从0开始的

d = c[2:4,2:4] 取中间的2-4行的2-4列

e = c[0,:] 取第0行所有数据

f = c[:,1] 取第1列所有数据

g = c[::2,::2] 两个冒号后面表示步长为2

不加班程序员

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录