![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
qq_37760746
这个作者很懒,什么都没留下…
展开
-
python使用numpy创建空二维数组,然后再将一维数组添加到二维数组中
【代码】python使用numpy创建空二维数组,然后再将一维数组添加到二维数组中。原创 2022-10-31 10:02:45 · 4987 阅读 · 1 评论 -
python爬取web of science
根据作者姓名在某年到某年所发表的文章,对文章的题目,期刊的影响因子进行爬取from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsimport csvimport re# from threading import Threadfrom multiprocessing import Processfrom multiprocessing import Managerimport re原创 2021-12-18 14:05:48 · 2347 阅读 · 3 评论 -
python 爬虫自动生成浏览器请求头
安装 fake_useragentpip3 install fake_useragent生成浏览器请求头的主要代码部分from fake_useragent import UserAgentua = UserAgent()print(ua.random)原创 2021-11-25 15:57:17 · 609 阅读 · 0 评论 -
python dataframe将数据分成多份
import mathimport pandas as pdfrom tqdm import tqdmdef cut_df(file_name, n): df = pd.read_csv(file_name) df_num = len(df) every_epoch_num = math.floor((df_num/n)) for index in tqdm(range(n)): file_name = f'./{index}.csv'原创 2021-11-16 15:56:43 · 2088 阅读 · 0 评论 -
python post请求头部伪装随机(防止封ip)
import randomdef get_headers(): ''' 随机获取一个headers ''' user_agents = ['Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1原创 2021-10-26 19:50:58 · 1407 阅读 · 0 评论 -
python 根据图片网址下载图片
# coding=gbkimport requestsdef download_img(img_url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36' } r = requests.get(img_url, header原创 2021-10-14 11:05:09 · 251 阅读 · 0 评论 -
决策树算法的python实现
import numpy as np import pandas as pddef calEnt(dataSet) : n = dataSet.shape[0] # 数据集总行数 iset = dataSet.iloc[: , -1] . value_counts() # 标签的所有类别 p = iset/n # 每一类标签所占比 ent = (-p*np.log2(p)).sum() # 计算信息熵 return entdef createDataS原创 2021-10-09 18:38:09 · 475 阅读 · 0 评论 -
K-近邻算法的python实现
#1.构建数据集import pandas as pdrowdata={' 电影名称 ' : [ ' 无问西东 ' , ' 后来的我们 ' , ' 前任 3 ' , ' 红海行动 ' , ' 唐人街探案 ' , ' 战狼 2 ' ] , ' 打斗镜头 ' : [ 1, 5 , 12 , 108,112,115] , ' 接吻镜头 ' : [ 101,89,97,5,9,8] , ' 电影类型 ' : [ ' 爱情片 ' , ' 爱情片 ' , ' 爱情片 ' , ' 动作片 ' , ' 动作片 ' ,原创 2021-10-08 11:08:48 · 51 阅读 · 0 评论 -
python 比对两个文档将一样的输出
file1 = "1.txt"file2 = "3.txt"#f_diff = "diff.txt"f1 = open(file1, "r")f2 = open(file2, "r")file1 = f1.readlines()file2 = f2.readlines()f1.close()f2.close()flag = 0'''for i in file1: if i not in file2: outfile.write(i) flag =原创 2021-09-18 20:08:59 · 468 阅读 · 0 评论 -
python 通过比对一个文档将文件夹的文件移动到指定文件
# -*- coding: utf-8 -*- import osfile2 = "3.txt"f2 = open(file2, "r")file2 = f2.readlines()f2.close()def file_name(file_dir): for root, dirs, files in os.walk(file_dir): return files #continue#print(file_name('/home/xjc/Desktop原创 2021-09-18 20:07:44 · 65 阅读 · 0 评论 -
python将照片转换为素描图片
# -*- coding: UTF-8 -*-from PIL import Image #图像处理模块import numpy as npimport osa = np.asarray(Image.open("25..jpg").convert('L')).astype('float') #将图像以灰度图的方式打开并将数据转为float存入np中depth = 10. # (0-100)grad = np.gradient(a)原创 2021-08-13 14:03:13 · 177 阅读 · 0 评论 -
python根据概率生成数
#!/usr/bin/python# -*- coding: utf-8 -*-import randomdef number_of_certain_probability(sequence, probability): x = random.uniform(0, 1) cumulative_probability = 0.0 for item, item_probability in zip(sequence, probability): cumulative原创 2021-07-04 17:25:28 · 568 阅读 · 0 评论 -
python将很多文件合并到一个文件
#coding=utf-8import osfiledir = os.getcwd()+'/airport'#airport是我的文件夹filenames=os.listdir(filedir)filenames.sort()f=open('result.json','w')#result.json是要将结果写入的文件a=0for filename in filenames: filepath =filedir+'/'+filename for line in open(fil原创 2021-06-07 20:48:03 · 431 阅读 · 1 评论 -
python 调用百度语音api和青云客制作对话机器人
#coding:utf-8from aip import AipSpeechfrom pyaudio import PyAudio,paInt16import requests,json,wave,time,pyttsx3from pydub import AudioSegmentimport sysimport osreload(sys)sys.setdefaultencoding('utf8')APP_ID = ''API_KEY = ''SECRET_KEY = ''clien原创 2021-04-20 18:53:15 · 1310 阅读 · 1 评论 -
python 生存分析或者生存时间预测
import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressionfrom sklearn.ensemble import RandomForestClassifier#导入数据#训练数据集train = pd.read_csv("train_data.csv")#测试数据集te原创 2020-12-25 12:09:14 · 894 阅读 · 0 评论 -
python 计算相关系数
python 计算相关系数import numpy as np ab = np.array([y,b]) #y和b分别是一个大小相同的一个数组,n行1列 print(np.corrcoef(ab))原创 2020-11-22 14:33:57 · 764 阅读 · 0 评论 -
python 实现聚类分析
python 实现聚类分析import numpy as npfrom sklearn.decomposition import PCAimport sysimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom sklearn.cluster import KMeansimport pandas as pddef main(): kms = KMeans(n_clusters=3)#归为3类原创 2020-11-22 14:07:54 · 591 阅读 · 0 评论 -
python 实现pca(主成分分析)降维处理
python 实现pca(主成分分析)降维处理import numpy as npfrom sklearn.decomposition import PCAimport sysimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Ddef main(): # test data #mat = [[-1,-1,0,2,1],[2,0,0,-1,-1],[2,0,1,1,0]] file1 =原创 2020-11-21 21:49:58 · 732 阅读 · 0 评论 -
python 计算GPA
# coding=utf-8a=int(raw_input('请输入科目数:'))#从命令行输入一个数字a,表示科目数量print('请输入:课程名 分数 学分,数据以空格隔开')d=0 #保存了每门课程的 成绩乘学分的和e=0 #保存了每门课程的学分和while a: #经过a次循环读取课程信息 a=a-1 #计数器迭代,每次循环减一 b=raw_input() #从命令行输入一行数据,即课程信息 c=b.split(' ') #将每一行输入的数据以空格进行分割,结果保存为一个列表,此原创 2020-07-13 18:15:28 · 2159 阅读 · 0 评论 -
python 实现arp协议
#!/usr/bin/env python3# -*- encoding = utf-8 -*-from scapy.all import *result_raw = srp(Ether(src="00:0c:29:56:d5:c7",dst='FF:FF:FF:FF:FF:FF')/ARP(op=1,hwsrc="00:0c:29:56:d5:c7",psrc="192.168.57.128",hwdst='00:00:00:00:00:00',pdst="192.168.57.129"),ifac原创 2020-07-18 12:17:34 · 521 阅读 · 0 评论