Python数据分析小技巧【01】

目录

1.将字符串翻转

 2.英文单词首字母大写

3.字符串去掉重复值

4.拆分字符串

5.将列表中的字符串连接起来

6.查看列表中各元素出现的次数

7.合并两个字典

8.查看程序运行的时间

 9.数组的扁平化

10.zip()函数

11.查看列表中是否有重复值

12.数组的转置

13.矩阵的转置 

14.找出两列表中的不同元素

 15.将两个列表合并成一个键和值对应的字典

16.根据字典当中的值对字典进行排序

17. 寻找列表中最大值/最小值的索引


1.将字符串翻转

my_Str = "ABCDE"
r_Str = my_Str[::-1]

print(r_Str)

output:

        EDCBA

 2.英文单词首字母大写

my_str = "my name is xiao ming"
# 通过title()方法来实现首字母大写
new_str = my_str.title()
print(new_str)

output:

        My Name Is Xiao Ming

3.字符串去掉重复值

my_str = "aabbbbbccccddddeeeff"
# 通过set()函数来进行去重
temp_set = set(my_str)
print(temp_set)
# 通过join()函数来进行连接
new_str = ''.join(temp_set)
print(new_str)

output:

        {'b', 'f', 'd', 'e', 'c', 'a'}
        bfdeca

4.拆分字符串

str_1 = "my name is li hua"
str_2 = "zhangwei, wanglei, xiaoming"

# 默认的分隔符是空格,来进行拆分
print(str_1.split())

# 根据分隔符","来进行拆分
print(str_2.split(','))

output:

        ['my', 'name', 'is', 'li', 'hua']
        ['zhangwei', ' wanglei', ' xiaoming']
 

5.将列表中的字符串连接起来

my_dict = ['my', 'name', 'is', 'li', 'hua']

# 通过空格和join来连词成句
print(' '.join(my_dict))

output:

        my name is li hua

6.查看列表中各元素出现的次数

from collections import Counter

mylist = ["a","b","b","c","c","c","d","d","d","d"]
count = Counter(mylist)
# 输出count的元素,统计出现的次数
print("count",count)
# 单独的“b”元素出现的次数
print("count['b']",count['b']) 
# 出现频率最多的元素
print(count.most_common(1)) 

output:

        count Counter({'d': 4, 'c': 3, 'b': 2, 'a': 1})
        count['b'] 2
        [('d', 4)]

7.合并两个字典

mydict_1 = {'a': 3, 'b': 4}
mydict_2 = {'c': 4, 'd': 5}
# 方法一
combined_dict = {**mydict_1, **mydict_2}
print("combined_dict", combined_dict)
# 方法二
mydict_1.update(mydict_2)
print("mydict_1", mydict_1)
# 方法三
print("mydict_1", dict(mydict_1.items() | mydict_2.items()))

output:

        combined_dict {'a': 3, 'b': 4, 'c': 4, 'd': 5}
        mydict_1 {'a': 3, 'b': 4, 'c': 4, 'd': 5}
        mydict_1 {'a': 3, 'd': 5, 'b': 4, 'c': 4}

8.查看程序运行的时间

import time

start_time = time.time()
########################
#具体的程序
for i in range(1,10):
    for j in range(1,50):
        print("i*j",i*j)
########################
end_time = time.time()
time_taken_in_micro = end_time- start_time
print(time_taken_in_micro)

output:

        0.015621423721313477

 9.数组的扁平化

将多个列表拉平成一个列表

a = [[1,3],[2,4],[3,5]]
a = np.array(a)
print(a.flatten())

output:

        [1 3 2 4 3 5]

10.zip()函数

zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。

如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。

a = ["白橙","白绿","白蓝","白棕"]
b = ["橙","蓝","绿","棕"]

zz = zip(a,b)
print("zz", list(zz)) #返回一个列表
print("zz", *zip(a,b))    #返回元组
print("a,b", list(zip(*zip(a,b))))     #zip的逆操作

for i,j in zip(a,b):
    print(i+j,end="")

output:

        zz [('白橙', '橙'), ('白绿', '蓝'), ('白蓝', '绿'), ('白棕', '棕')]
        zz ('白橙', '橙') ('白绿', '蓝') ('白蓝', '绿') ('白棕', '棕')
        a,b [('白橙', '白绿', '白蓝', '白棕'), ('橙', '蓝', '绿', '棕')]
        白橙橙白绿蓝白蓝绿白棕

# 创建2个列表
m = [1, 2, 3]
n = [4, 5, 6]

print("*zip(m, n)返回:", *zip(m, n))
m2, n2 = zip(*zip(m, n))
print("m2和n2的值分别为:", m2, n2)
# 若相等,返回True;说明*zip为zip的逆过程
print(m == list(m2) and n == list(n2))

output:

        *zip(m, n)返回: (1, 4) (2, 5) (3, 6)
        m2和n2的值分别为: (1, 2, 3) (4, 5, 6)
        True

11.查看列表中是否有重复值

def unique(z):
    if len(z)==len(set(z)):
        print("没有重复值!")
    else:
        print("有重复值!")


unique([1,2,3,4])
# 没有重复值!

unique([1,1,2,3])
# 有重复值!

z = [1,2,2,5]
unique(z)
# 有重复值!

12.数组的转置

array = [['a', 'b'], ['c', 'd'], ['e', 'f']]
print("array", array)
transposed = zip(*array)
print(list(transposed))

output:

        array [['a', 'b'], ['c', 'd'], ['e', 'f']]
        [('a', 'c', 'e'), ('b', 'd', 'f')]

13.矩阵的转置 

# 导入numpy包
from numpy import *
# 创建一个矩阵
a = mat([[1,2,3],[4,5,6],[7,8,9]])
print(a)
# 矩阵转置
b = a.T
print(b)

output:

             a:   [[1 2 3]
                   [4 5 6]
                   [7 8 9]]
            b:   [[1 4 7]
                   [2 5 8]
                   [3 6 9]]

14.找出两列表中的不同元素

difference() 方法用于返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合(方法的参数)中。

difference() 方法语法:

set.difference(set)
def difference(a, b):
    set_a = set(a)
    set_b = set(b)
    comparison = set_a.difference(set_b)
    return list(comparison)

# 返回第一个列表有,第二个列表没有的元素
print(difference([1,2,3], [6,2,1]))

output:

              [3]

 15.将两个列表合并成一个键和值对应的字典

def my_dict(keys, values):
    return dict(zip(keys, values))


keys = ["a", "b", "c"]
values = [1, 2, 3]
print(my_dict(keys, values))

output:

        {'a': 1, 'b': 2, 'c': 3}

16.根据字典当中的值对字典进行排序

d = {'apple': 9, 'grape': 4, 'banana': 6, 'orange': 8}
# 方法一
print(sorted(d.items(), key = lambda x: x[1])) # 按照下标为1的元素,从小到大排序

print(sorted(d.items(), key = lambda x: x[1], reverse = True)) # 从大到小排序

# 方法二
from operator import itemgetter
# 按照下标为2的值对列表进行排序,默认由小到大排序,reverse = True表示从大到小排序
print(sorted(d.items(), key = itemgetter(1)))

output:

        [('grape', 4), ('banana', 6), ('orange', 8), ('apple', 9)]
        [('apple', 9), ('orange', 8), ('banana', 6), ('grape', 4)]
        [('grape', 4), ('banana', 6), ('orange', 8), ('apple', 9)]
 

17. 寻找列表中最大值/最小值的索引

list1 = [2, 3, 5, 6, 7, 8]

def max_index(list_test):
    return max(range(len(list_test)), key = list_test.__getitem__)

def min_index(list_test):
    return min(range(len(list_test)), key = list_test.__getitem__)

# 最大值索引
print(max_index(list1))
# 最小值索引
print(min_index(list1))

output:

             5
             0

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值