Python数据分析小技巧【01】

最新推荐文章于 2024-04-24 19:36:16 发布

子木同学

最新推荐文章于 2024-04-24 19:36:16 发布

阅读量250

点赞数 1

分类专栏： python数据分析文章标签： python 数据分析

本文链接：https://blog.csdn.net/Bigboss7/article/details/118855820

版权

python数据分析专栏收录该内容

5 篇文章 15 订阅

订阅专栏

15.将两个列表合并成一个键和值对应的字典

16.根据字典当中的值对字典进行排序

17. 寻找列表中最大值/最小值的索引

1.将字符串翻转

my_Str = "ABCDE"
r_Str = my_Str[::-1]

print(r_Str)

output：

EDCBA

2.英文单词首字母大写

my_str = "my name is xiao ming"
# 通过title()方法来实现首字母大写
new_str = my_str.title()
print(new_str)

output：

My Name Is Xiao Ming

3.字符串去掉重复值

my_str = "aabbbbbccccddddeeeff"
# 通过set()函数来进行去重
temp_set = set(my_str)
print(temp_set)
# 通过join()函数来进行连接
new_str = ''.join(temp_set)
print(new_str)

output：

{'b', 'f', 'd', 'e', 'c', 'a'}
bfdeca

4.拆分字符串

str_1 = "my name is li hua"
str_2 = "zhangwei, wanglei, xiaoming"

# 默认的分隔符是空格，来进行拆分
print(str_1.split())

# 根据分隔符"，"来进行拆分
print(str_2.split(','))

output：

['my', 'name', 'is', 'li', 'hua']
['zhangwei', ' wanglei', ' xiaoming']

5.将列表中的字符串连接起来

my_dict = ['my', 'name', 'is', 'li', 'hua']

# 通过空格和join来连词成句
print(' '.join(my_dict))

output：

my name is li hua

6.查看列表中各元素出现的次数

from collections import Counter

mylist = ["a","b","b","c","c","c","d","d","d","d"]
count = Counter(mylist)
# 输出count的元素，统计出现的次数
print("count",count)
# 单独的“b”元素出现的次数
print("count['b']",count['b']) 
# 出现频率最多的元素
print(count.most_common(1))

output：

        count Counter({'d': 4, 'c': 3, 'b': 2, 'a': 1})
        count['b'] 2
        [('d', 4)]

7.合并两个字典

mydict_1 = {'a': 3, 'b': 4}
mydict_2 = {'c': 4, 'd': 5}
# 方法一
combined_dict = {**mydict_1, **mydict_2}
print("combined_dict", combined_dict)
# 方法二
mydict_1.update(mydict_2)
print("mydict_1", mydict_1)
# 方法三
print("mydict_1", dict(mydict_1.items() | mydict_2.items()))

output：

        combined_dict {'a': 3, 'b': 4, 'c': 4, 'd': 5}
        mydict_1 {'a': 3, 'b': 4, 'c': 4, 'd': 5}
        mydict_1 {'a': 3, 'd': 5, 'b': 4, 'c': 4}

8.查看程序运行的时间

import time

start_time = time.time()
########################
#具体的程序
for i in range(1,10):
    for j in range(1,50):
        print("i*j",i*j)
########################
end_time = time.time()
time_taken_in_micro = end_time- start_time
print(time_taken_in_micro)

output：

0.015621423721313477

9.数组的扁平化

将多个列表拉平成一个列表

a = [[1,3],[2,4],[3,5]]
a = np.array(a)
print(a.flatten())

output：

[1 3 2 4 3 5]

10.zip()函数

zip() 函数用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的列表。

如果各个迭代器的元素个数不一致，则返回列表长度与最短的对象相同，利用 * 号操作符，可以将元组解压为列表。

a = ["白橙","白绿","白蓝","白棕"]
b = ["橙","蓝","绿","棕"]

zz = zip(a,b)
print("zz", list(zz)) #返回一个列表
print("zz", *zip(a,b))    #返回元组
print("a,b", list(zip(*zip(a,b))))     #zip的逆操作

for i,j in zip(a,b):
    print(i+j,end="")

output：

        zz [('白橙', '橙'), ('白绿', '蓝'), ('白蓝', '绿'), ('白棕', '棕')]
        zz ('白橙', '橙') ('白绿', '蓝') ('白蓝', '绿') ('白棕', '棕')
        a,b [('白橙', '白绿', '白蓝', '白棕'), ('橙', '蓝', '绿', '棕')]
        白橙橙白绿蓝白蓝绿白棕

# 创建2个列表
m = [1, 2, 3]
n = [4, 5, 6]

print("*zip(m, n)返回:", *zip(m, n))
m2, n2 = zip(*zip(m, n))
print("m2和n2的值分别为:", m2, n2)
# 若相等，返回True；说明*zip为zip的逆过程
print(m == list(m2) and n == list(n2))

output：

        *zip(m, n)返回： (1, 4) (2, 5) (3, 6)
        m2和n2的值分别为： (1, 2, 3) (4, 5, 6)
        True

11.查看列表中是否有重复值

def unique(z):
    if len(z)==len(set(z)):
        print("没有重复值！")
    else:
        print("有重复值！")


unique([1,2,3,4])
# 没有重复值！

unique([1,1,2,3])
# 有重复值！

z = [1,2,2,5]
unique(z)
# 有重复值！

12.数组的转置

array = [['a', 'b'], ['c', 'd'], ['e', 'f']]
print("array", array)
transposed = zip(*array)
print(list(transposed))

output：

array [['a', 'b'], ['c', 'd'], ['e', 'f']]
[('a', 'c', 'e'), ('b', 'd', 'f')]

13.矩阵的转置

# 导入numpy包
from numpy import *
# 创建一个矩阵
a = mat([[1,2,3],[4,5,6],[7,8,9]])
print(a)
# 矩阵转置
b = a.T
print(b)

output：

a: [[1 2 3]
[4 5 6]
[7 8 9]]
b: [[1 4 7]
[2 5 8]
[3 6 9]]

14.找出两列表中的不同元素

difference() 方法用于返回集合的差集，即返回的集合元素包含在第一个集合中，但不包含在第二个集合(方法的参数)中。

difference() 方法语法：
set.difference(set)

def difference(a, b):
    set_a = set(a)
    set_b = set(b)
    comparison = set_a.difference(set_b)
    return list(comparison)

# 返回第一个列表有，第二个列表没有的元素
print(difference([1,2,3], [6,2,1]))

output：

[3]

15.将两个列表合并成一个键和值对应的字典

def my_dict(keys, values):
    return dict(zip(keys, values))


keys = ["a", "b", "c"]
values = [1, 2, 3]
print(my_dict(keys, values))

output：

{'a': 1, 'b': 2, 'c': 3}

16.根据字典当中的值对字典进行排序

d = {'apple': 9, 'grape': 4, 'banana': 6, 'orange': 8}
# 方法一
print(sorted(d.items(), key = lambda x: x[1])) # 按照下标为1的元素，从小到大排序

print(sorted(d.items(), key = lambda x: x[1], reverse = True)) # 从大到小排序

# 方法二
from operator import itemgetter
# 按照下标为2的值对列表进行排序，默认由小到大排序，reverse = True表示从大到小排序
print(sorted(d.items(), key = itemgetter(1)))

output：

        [('grape', 4), ('banana', 6), ('orange', 8), ('apple', 9)]
        [('apple', 9), ('orange', 8), ('banana', 6), ('grape', 4)]
        [('grape', 4), ('banana', 6), ('orange', 8), ('apple', 9)]

17. 寻找列表中最大值/最小值的索引

list1 = [2, 3, 5, 6, 7, 8]

def max_index(list_test):
    return max(range(len(list_test)), key = list_test.__getitem__)

def min_index(list_test):
    return min(range(len(list_test)), key = list_test.__getitem__)

# 最大值索引
print(max_index(list1))
# 最小值索引
print(min_index(list1))

output：

5
0

子木同学

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python数据分析小技巧【01】

1.将字符串翻转my_Str = "ABCDE"r_Str = my_Str[::-1]print(r_Str)output：EDCBA2.英文单词首字母大写my_str = "my name is xiao ming"# 通过title()来实现首字母大写new_str = my_str.title()print(new_str)output：My Name Is Xiao Ming3.字符串去掉重复值my_str = "aabbbbbcc.
复制链接

扫一扫

专栏目录