Python
未来影子
曾先后在百度、理想、快手参与研发工作
后端、大数据、NLP学习者
展开
-
Python中数组的操作:沿着一个维度复制并扩增矩阵
命令如下:np.expand_dims(a,0).repeat(3,axis=0)原创 2022-08-25 18:05:26 · 1708 阅读 · 0 评论 -
conda中设置源
文章目录添加源清华源腾讯源移除源清华源腾讯源打印当前channels系统中的配置文件使用pip源添加源清华源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config --add channels h原创 2022-05-22 21:32:57 · 10632 阅读 · 0 评论 -
python的namedtuple
namedtuple:namedtuple类位于collections模块,有了namedtuple后通过属性访问数据能够让我们的代码更加的直观更好维护。namedtuple能够用来创建类似于元祖的数据类型,除了能够用索引来访问数据,能够迭代,还能够方便的通过属性名来访问数据。在python中,传统的tuple类似于数组,只能通过下表来访问各个元素,我们还需要注释每个下表代表什么数据。通过使用namedtuple,每哥元素有了自己的名字。类似于C语言中的struct,这样数据的意义就可以一目了然。生命原创 2021-10-23 17:22:34 · 170 阅读 · 0 评论 -
爬虫项目——m3u8后缀的电影
# -*- coding: utf-8 -*-"""Created on Wed Oct 6 10:47:47 2021@author: yingziE-mail:guotaomath@163.com"""'''目标:找到目标网页,源代码中已找到m3u8,且通过抓包工具知道,第一层m3u8嵌套第二层m3u8(真实ts的下载地址),视频无加密''''''流程: 1. 拿到网页源代码 2. 从网页源代码提取第一层m3u8的url 3. 解析第一层的m3u8,原创 2021-10-06 13:42:04 · 936 阅读 · 0 评论 -
递归典型——汉诺塔问题
目标:将A上的圆盘全部移动到C上分析:对于这样一个问题,任何人都不可能直接写出移动盘子的每一步,但我们可以利用下面的方法来解决。设移动盘子数为n,为了将这n个盘子从A杆移动到C杆,可以做以下三步:1.把n-1个圆盘从A经过C移动到B2.把第n个圆盘从A移动到C3.把n-1个圆盘从B经过A移动到C代码如下:def hanoi(n,a,b,c): if n>0: hanoi(n-1,a,c,b) print("moving from %s to %.原创 2021-10-05 12:43:57 · 115 阅读 · 0 评论 -
爬虫项目——xpath练手(1)
本文爬取目标网址中的电影名,介绍,及评分前期准备:工具:Spyder引用的库:requests,csv,lxml里的 etree1.前期基本处理:url = "https://film.sohu.com/list_4_0_0_0_0_1_60.html?channeled=1200100000"headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,原创 2021-10-03 20:44:10 · 369 阅读 · 0 评论 -
爬虫项目——BS练手(2)
本文爬取目标网址的图片,原创 2021-10-03 13:44:00 · 302 阅读 · 0 评论 -
爬虫项目——BS4练手(1)
本文爬取目标网页表格中的内容,提取(品名,最高价,最低价,均价)信息,导入csv文件中前期准备:工具:Spyder引用的库:requests,bs4中的BeautifulSoup,csv1.获取目标网址信息url = "http://www.whbsz.com.cn/"resp = requests.get(url)2.解析数据,将页面源代码交给BeautifulSoup进行处理,生成bs对象page = BeautifulSoup(resp.text,"html.parser")原创 2021-10-03 11:55:40 · 482 阅读 · 0 评论 -
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))决办法:pip install selenium -i http://pypi.douban.com/simple --trusted-host pypi.douban.com(其中的selenium是你需要下载的,根据自己需求自行更改)...原创 2021-09-29 19:50:36 · 349 阅读 · 0 评论 -
Python教材(数据分析、数据挖掘与可视化)——第7章课后习题
1."超市营业额2.xlsx"查看单日交易总额最小的3天的交易数据,并查看这3天是周几。2."超市营业额2.xlsx"把所有员工的工号前面增加一位数字,增加的数字和原工号最后一位相同,把修改后的数据写入新文件“超市营业额2_修改工号.xlsx“。例如,工号1001变为1101,1003变为310033.把每个员工的交易额数据邪入文"各员工数据,xlsx",每个员工的数据占一个worksheet,结构和"超市营业额2.xlsx"一样,并以员工姓名作为worksheet的标题4.查阅资料,根据本章用到的文原创 2021-04-18 16:10:50 · 12841 阅读 · 4 评论 -
应用Python绘制雷达图时遇到的坑
ValueError: The number of FixedLocator locations (9), usually from a call to set_ticks, does not match the number of ticklabels (8).运行书中例题时发现了这个错误,原代码如上:import numpy as npimport matplotlib.pyplot as pltimport matplotlibmatplotlib.rcParams['font.fami原创 2021-04-17 21:48:42 · 3923 阅读 · 2 评论 -
初级算法——删除排序数组中的重复项
题目来源题目描述:给你一个有序数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。示例一:输入:nums = [1,1,2]输出:2, nums = [1,2]解释:函数应该返回新的长度 2 ,并且原数组 nums 的前两个元素被修改为 1, 2 。不需要考虑数组中超出新长度后面的元素示例二:输入:nums = [0,0,1,1,1,2,2,3,3原创 2021-04-15 09:24:04 · 109 阅读 · 0 评论 -
标准BP算法、累积BP算法Python实现
标准BP,累积BP算法原理及MATLAB自编写实现在这里以下是自己编写的Python的代码,欢迎指正import numpy as npx=np.matrix(np.random.rand(3,2)) #输入层,随机生成3个样本,每个样本有4个神经元y=np.matrix(np.random.rand(3,2)) #输出层,随机生成3个样本,每个样本有2个神经元q=3N=100000k = 0.1'''q: 隐层单元数目v: 输入层到隐层的权值r: 隐层的阀值w: 隐层到输出层的原创 2021-04-12 22:19:11 · 3612 阅读 · 7 评论 -
标准BP算法matlab实现,简单易懂
机器学习的实验课要求自编写一份简易的标准BP(神经网络)算法,我用matlab基本实现了,现将自己的思想记录下来,方便自己以后重温.话不多说,让我们进入正题简要介绍神经网络中最基本的成分是神经元模型,先简单提一个最简单的神经元模型M-P神经元模型该神经元模型有两层:输入层,输出层。其中输入层包含 n 个神经元,输出层包含 1 个神经元。输入信号通过连接的权重wiw_iwi到达输出神经元,总接收的输入值与阀值θ\thetaθ进行比较,然后通过"激活函数"处理以产生神经元的输出。这里介绍一个最具原创 2021-04-10 23:02:31 · 7385 阅读 · 6 评论 -
机器学习(周志华)——对数几率回归
课后习题3.3,编程实现对率回归,并给出西瓜数据集3.0 a\ a a上的结果由公式(3.23)、(3.29)、(3.30)、(3.31)进行公式带入,实现matlab的算法如下:clear;clctic%初始数据集x=[0.697 0.460 0.774 0.376 0.634 0.264 0.608 0.318 0.556 0.215 0.403 0.237 0.481 0.149 0.437 0.211原创 2021-03-21 19:02:12 · 2338 阅读 · 2 评论 -
机器学习(周志华)——决策树问题
matlab算法实现:## 标题原创 2021-03-28 14:32:16 · 230 阅读 · 0 评论 -
Python——不用numpy实现行列式的计算
import numpy as npdef det(mat): A = 0 n=len(mat) if n == 1: A = mat[0][0] return A if n == 2: A = mat[0][0] * mat[1][1] - mat[0][1] * mat[1][0] return A b = [0 for x in range(n)] t1 = [[0 for x in原创 2021-04-08 21:15:25 · 1094 阅读 · 1 评论 -
Python教材(数据分析、数据挖掘与可视化)——第四章课后习题
题目1.接收一个正整数作为参数,返回对齐进行因式分解后的结果列表。例如,接收参数50,返回[2,5,5]2.接收两个正整数参数n和a(a要求小于10的自然数),计算形式入a+aa+aaa+…+aaa.aaa的表达式前n项的值3.模拟报数游戏。有n个人围成一圈,从0到n-1按顺序编号,从第一个人开始从1到k报数,报到k的人退出圈子,然后圈子缩小,从下一个人继续游戏,问最后留下的是原来的第几号。4.接收一个字符串作为参数,判断该字符串是否为回文(正读和反读都一样的字符串),如果是则返回True,否则返原创 2021-03-24 23:07:35 · 4106 阅读 · 1 评论 -
Python教材(数据分析、数据挖掘与可视化)——第三章课后习题
一、题目:1、输入一个字符串,输出其中每个字符的出现次数。要求使用标准库collotections中的Counter类。2、输入一个字符串,输出其中只出现了一次的字符及其下标。3、输入一个字符串,输出其中每个唯一字符最后一次出现的下标。4、输入包含若干集合的列表,输出这些集合的并集。提示:使用reduce()函数和operator模块中的运算实现多个集合的并集。5、输入一个字符串,输出加密后的结果字符串。加密规则为:每个字符的Unicode编码和下一个字符的Unicode编码相减, 用这个差的绝对原创 2021-03-24 11:09:05 · 4044 阅读 · 0 评论 -
Python教材(数据分析、数据挖掘与可视化)——第二章课后习题
第二章课后编程题1.输入一个包含若干个自然数的列表,输出这些列表自然数的平均值,结果保留3位小数s = eval(input("求平均,请输入自然数列表:")) # 输入自然数的列表sum = 0for i in s: sum += iavg = sum / len(s)print('输入列表的平均值(保留3位小数)为:'+'%.3f'% avg)2.输入一个包含若干个自然数的列表,输出这些自然数降序排列后的新列表print("输入两个包含若干整数的等长列表,输出两内积")s1原创 2021-03-19 19:49:30 · 5772 阅读 · 0 评论