python 函数篇 -4

调用函数

官方文档

Python的官方网站查看文档:
http://docs.python.org/3/library/functions.html#abs

abs()函数

#求绝对值。只能传入一个参数
>>> abs(100)
100
>>> abs(-20)
20
>>> abs(12.34)
12.34
abs()函数注意事项
1.如果传入的参数数量不对,会报TypeError的错误
2.参数类型不能被函数所接受,也会报TypeError的错误

max()函数

#返回最大值的数,可以传入多个参数
>>> max(1, 2)
2
>>> max(2, 3, 1, -5)
3

hex()函数

把一个整数转换成十六进制表示的字符串

定义函数

def关键字特性

定义一个函数要使用def语句,依次写出函数名、括号、括号中的参数和冒号:,然后,在缩进块中编写函数体,函数的返回值用return语句返回。
def my_abs(x):
    if x >= 0:
        return x
    else:
        return -x

空函数

def nop():
    pass

ps:pass可以用来作为占位符,比如现在还没想好怎么写函数的代码,就可以先放一个pass,让代码能运行起来。    

返回多个值

import math

def move(x, y, step, angle=0):
    nx = x + step * math.cos(angle)
    ny = y - step * math.sin(angle)
    return nx, ny
ps:1.import math语句表示导入math包,并允许后续代码引用math包里的sin、cos等函数。
   2.Python的函数返回多值其实就是返回一个tuple

函数的参数

python函数参数特性说明

1.Python的函数定义非常简单,但灵活度却非常大。除了正常定义的必选参数外,还可以使用默认参数、可变参数和关键字参数,使得函数定义出来的接口,不但能处理复杂的参数

位置参数

'''
演示目标:根据传入的两个参数计算乘方和
    传入两个参数
    num : 被计算的整数
    n:乘方次数
'''
def power(num,n):
    s = 1
    while n > 0:
        n = n - 1
        s = s * num
    return s   

print(power(5, 2)) 
运行结果:
25

默认参数

def enroll(name, gender, age=6, city='Beijing'):
    print('name:', name)
    print('gender:', gender)
    print('age:', age)
    print('city:', city)
enroll('Sarah', 'F')    
运行结果:
name: Sarah
gender: F
age: 6
city: Beijing

可变参数

1.把list数组当做参数传入
def calc(numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum    
运行结果
#但是调用的时候,需要先组装出一个list或tuple:
>>> calc([1, 2, 3])
14
>>> calc((1, 3, 5, 7))
84

#利用可变参数,调用函数的方式可以简化成这样:
>>> calc(1, 2, 3)
14
>>> calc(1, 3, 5, 7)
84
2.tuple数组当做参数传入
#定义可变参数和定义一个list或tuple参数相比,仅仅在参数前面加了一个*号
def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum
3.Python允许你在list或tuple前面加一个*号,把list或tuple的元素变成可变参数传进去
>>> nums = [1, 2, 3]
>>> calc(*nums)
14

关键字参数

1.关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict
def person(name, age, **kw):
    print('name:', name, 'age:', age, 'other:', kw)
运行结果
#函数person除了必选参数name和age外,还接受关键字参数kw。在调用该函数时,可以只传入必选参数:
>>> person('Michael', 30)
name: Michael age: 30 other: {}

命名关键字参数

后续完成

参数组合

后续完成

递归函数

演示Demo

def fact(n):
    if n==1:
        return 1
    return n * fact(n - 1)

运行结果

>>> fact(1)
1
>>> fact(5)
120
>>> fact(100)
93326215443944152681699238856266700490715968264381621468592963895217599993229915608941463976156518286253697920827223758251185210916864000000000000000000000000

递归函数计算过程分析

===> fact(5)
===> 5 * fact(4)
===> 5 * (4 * fact(3))
===> 5 * (4 * (3 * fact(2)))
===> 5 * (4 * (3 * (2 * fact(1))))
===> 5 * (4 * (3 * (2 * 1)))
===> 5 * (4 * (3 * 2))
===> 5 * (4 * 6)
===> 5 * 24
===> 120
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: TF-IDF是一种常用的文本特征提取方法,可以用Python来实现。 首先,计算每个单词在文档中的词频(TF): ```python def compute_tf(text): tf_text = {} for word in text.split(): tf_text[word] = tf_text.get(word, 0) + 1 return tf_text ``` 然后,计算每个单词在所有文档中的逆文档频率(IDF): ```python import math def compute_idf(word, corpus): return math.log10(len(corpus) / sum(1 for text in corpus if word in text)) ``` 最后,将TF和IDF相乘,得到TF-IDF: ```python def compute_tfidf(text, corpus): tf_idf_text = {} tf_text = compute_tf(text) for word, tf in tf_text.items(): tf_idf_text[word] = tf * compute_idf(word, corpus) return tf_idf_text ``` 这个实现可以计算一文档的TF-IDF值,如果要计算整个语料库的TF-IDF,需要先将所有文档合并成一个大的文本,然后传递给上面的`compute_tfidf`函数即可。 ### 回答2: TF-IDF(Term Frequency-Inverse Document Frequency)是一种用于文本特征提取和文本相似度计算的常用算法。下面是用Python实现TF-IDF的步骤: 1. 对文本数据进行预处理,包括停用词的过滤、分词、去除标点和数字等操作。 2. 计算词频(Term Frequency,TF),即每个词在文档中出现的频率。可以使用Python中的Counter库实现,统计每个词在文档中的出现次数。 3. 计算逆文档频率(Inverse Document Frequency,IDF),即衡量词语在整个语料库中的重要性。可以使用以下公式计算:IDF = log(N / (DF + 1)),其中N表示语料库中文档的总数,DF表示包含该词的文档数目。如果一个词出现在很多文档中,则IDF值较小。 4. 计算TF-IDF,可以使用以下公式:TF-IDF = TF * IDF。 5. 进行文本特征提取,将文本表示为TF-IDF矩阵。矩阵的每一行表示一个文档,每一列表示一个词。矩阵中的元素是每个词的TF-IDF值。 Python中可以使用sklearn库的TfidfVectorizer类来实现TF-IDF。首先,需要对文本进行预处理,然后使用TfidfVectorizer进行特征提取。 下面是一个简单的示例代码: ```python from sklearn.feature_extraction.text import TfidfVectorizer import nltk from nltk.corpus import stopwords # 读取文本文件 with open('text.txt', 'r') as file: text = file.read() # 分词并去除停用词和标点 tokens = nltk.word_tokenize(text.lower()) tokens = [token for token in tokens if token.isalpha() and token not in stopwords.words('english')] # 计算TF-IDF vectorizer = TfidfVectorizer() tfidf_matrix = vectorizer.fit_transform([" ".join(tokens)]) # 打印词汇表和TF-IDF矩阵 print("Vocabulary:", vectorizer.get_feature_names()) print("TF-IDF Matrix:", tfidf_matrix.toarray()) ``` 以上代码通过读取一个文本文件,对文本进行分词、去除停用词和标点,然后使用TfidfVectorizer计算TF-IDF矩阵。最后打印出词汇表和TF-IDF矩阵。 通过以上步骤,我们可以实现TF-IDF算法并获得文本的TF-IDF表示。这种表示可以用于文本聚类、分类、相似度计算等应用。 ### 回答3: TF-IDF(Term Frequency-Inverse Document Frequency)是一种常用于文本挖掘和信息检索的技术,可以帮助计算一个词在一个文档集合中的重要程度。 Python中可以使用多种方法实现TF-IDF,下面给出一种简单的实现方式: 首先,我们需要计算每个文档中每个词的出现频率(TF),可以使用`CountVectorizer`类来实现。该类可以将文本集合转化为一个词频矩阵``,其中每一行表示一个文档的词频向量。 接下来,我们需要计算每个词的逆文档频率(IDF)。可以通过计算每个词在整个文档集合中出现的文档数目来实现。可以使用`TfidfTransformer`类来计算IDF,并利用之前计算的词频矩阵`X`来得到TF-IDF矩阵: ```python from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer # 假设有一个文档集合 docs docs = ["This is the first document.", "This document is the second document.", "And this is the third one.", "Is this the first document?"] # 创建 CountVectorizer 对象,并拟合文本数据 count_vectorizer = CountVectorizer() X = count_vectorizer.fit_transform(docs) # 创建 TfidfTransformer 对象,并计算TF-IDF tfidf_transformer = TfidfTransformer() tfidf_matrix = tfidf_transformer.fit_transform(X) ``` 最后,得到的`tfidf_matrix`就是TF-IDF矩阵,其中每一行表示一个文档的TF-IDF向量。 以上是一个简单的Python实现TF-IDF的方法,当然还有其他的实现方式,可以根据具体需求进行选择。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值