大数据Python基础学习
文章平均质量分 72
喜欢你,还有大家
acg爱好者
展开
-
用Python写一个点餐的小程序
2 我应该可以选择商品,输入购买数量。3 商品需要价格,购买进行价格核算。1 需要一个二级菜单返回键。4 取消已经购买的商品。原创 2023-02-16 16:47:01 · 2090 阅读 · 0 评论 -
爬虫反爬机制——代理IP的使用
当请求网站的次数过多时,当前网站就会封闭你的请求ip,从而让你没有办法爬取到那些正确的信息,代理IP可以起到中间层的作用,使用以后能够让爬虫伪装自己的真实IP,从而无法实施封禁行为,不过也不是所有的代理ip都很实用。这两个是我常用的代理ip的网站,初次登录会有免费的代理ip可以领取,但大多时效短、稳定性差,用来测试ip的效果还行,爬取大量信息的话就有些力有不逮了。这是一个测试ip可行性的网站,可以检测出你当前所处的ip地址,结合代理ip就可以测试这些ip能否打印出正确的地址,保证ip的可用性。原创 2023-02-15 20:16:26 · 904 阅读 · 0 评论 -
有关Python的一些基础面试题
首先,通过selenium分析网站,将我们所需要的页面源码找出来,复制到自定义的html文件中,之后我们会利用Xpath从这个自定义的文件中将数据爬取出来。原创 2023-02-10 09:50:32 · 484 阅读 · 0 评论 -
基于Python的AST极验解密
很快就能想到,在JS代码里将字符串"AJgjJ.DAi()“逐个匹配出来,拿到括号里的索引数字,然后将数字值传入函数AJgjJ.DAi()计算得到字符串结果,然后将结果替换代码里的字符串"AJgjJ.DAi()”,就实现了还原的目的了。在这里concat()是合并数组的作用,而之后的几行代码调用的方式也都表示这里跟数组有关,通过索引就能取出值来,返回值都是字符串类型。上图是复制到test.js中的代码,通过命令行窗口测试,可以得到网站打断点时测试出来的相同的结果,可以预料到这个代码是能够运行的。原创 2023-02-09 14:02:29 · 609 阅读 · 0 评论 -
基于Python的JS逆向和AST抽象语法树
作用: 主要作用是为了防止js混淆的,一定程度上还原混淆,让代码的可读性提高。而在使用的过程中,我们就不可避免的用到了这个在线解析网站。注意,这里的3是个人口算出来的,在实际操作过程中,是需要获取 "+" 两边的值并计算其结果的。当你觉得你访问的路径已经完成了改完成的事,对代码已经没什么作用了,可以将其删除,可以看到,上面就是一个个的节点,这也是我们再熟悉不过的JSON结构的数据,这样的代码,很少有人能看得懂,但是将其加载到AST中就会变得好看一些。首先,我们在很多网站的源代码中,不可避免的会遇到类似于。原创 2023-02-05 11:40:01 · 658 阅读 · 0 评论 -
基于Python的bilibili会员购数据爬取
通过分析链接可得所需要爬取的数据都在这个页面,并且通过链接可以看到不通的页面page和不通的类型type之间都有差别,可以通过这些差别来爬取不同页面或不同类型的数据。六、虽然顺序有些不太对,但内容是完整的,另外如果遇到装包的问题可以直接通过pip镜像源来装,不过这种情况大概非常少见,毕竟都是很常见的包。三、编写代码来爬取数据(这里我只用了最粗糙的代码,便于理解。二、右键检查网页源码,找到所需要爬取的数据所在的位置。五、查看爬取到的内容,可以看到信息都已经爬取出来了。一、确定好需要爬取的网站。原创 2023-01-17 17:53:27 · 3755 阅读 · 6 评论 -
大数据python面试题(陈旧版)
可变类型(mutable):变量进行append、+=等这种操作后 == 改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。# 3、GET请求的数据参数是直接显示在URL中的,可以直接看到的,POST请求的数据参数放在请求头中,所以安全度比GET高一点,但是两者都是不安全的,数据参数都是可以被提取出来的。hdsllfdhg;原创 2022-11-19 13:33:21 · 517 阅读 · 0 评论 -
大数据Python面试题
首先深拷贝和浅拷贝都是对象的拷贝,都会生成一个看起来相同的对象,他们本质的区别是拷贝出来的对象的地址是否和原对象一样。局部变量,就是在函数内部定义的变量,其作用范围是这个函数内部,即只能在这个函数中使用,在函数的外部是不能使用的。(2)、浅拷贝:对原对象值的拷贝,地址仍然指向原对象的地址,原对象的值发生变化,拷贝对象的值也会随着改变。(1)、深拷贝:拷贝了一份与原对象不同地址的对象,修改对象中的任何值,都不会改变深拷贝的对象的值。生成器(特殊的迭代器,用——iter,——yield函数返回的才是生成器)原创 2022-11-13 11:50:33 · 485 阅读 · 0 评论 -
大数据Python基础学习——练习(二)
找到安装python的目录,进入到lib下的site-packages文件夹下新建一个myfile(自定义名字)的文件夹,进入到其中,新建两个.py文件:__init__.py和(自定义名称).py@classmethod#装饰器,给函数加一个能被类调用的特性,不需要实例化也可以调用def get_data(self,n):#定义一个斐波那契数列的方法x,y = 0,1yield x#打印出斐波那契数列print(i)结果i can runhello。原创 2022-10-26 14:52:34 · 810 阅读 · 0 评论 -
大数据Python基础学习——练习(一)
方法一此算法存在缺陷,取出的名字根据集合去重,有可能取到少于提取数量的名字个数a = input('请输入学员的名字,退出请按q:')breakelse:b = int(input('请输入你想提取的名字个数:'))breakdianming()方法二#创造一定数量的名字#random.shuffle方法else:return '名字数量不足'#random.choice方法breakelse:return '名字数量不足'#random.randrange方法break。原创 2022-10-19 21:04:02 · 903 阅读 · 0 评论 -
大数据Python基础——第四章 Python数据类型、流程控制和循环结构
在Python中,while循环和if条件分支语句类似,即在条件(表达式)为真的情况下,会执行相应的代码块,只要条件为真,就会一直重复执行。可以使用index索引访问元组中的某个元素(得到的是一个元素的值),也可以使用切片访问元组中的一组元素(得到的是一个新的子元组)元祖可以存储整数,实数,字符串,列表,元组等任何类型的数据,在同一个元组中,数据类型多样且没有个数限制。其中,listname 表示列表名字,i 表示索引值。常用于遍历字符串,列表,元组,字典,集合等序列类型,逐个获取序列中的各个元素。原创 2022-10-06 22:09:44 · 998 阅读 · 0 评论 -
大数据Python基础——第一章 搭建环境
一. 从百度官网处下载最新版或者其他版本的Python软件。1.附下载链接:2.点击直接下载,版本加载更新了许多新的板块,在实际应用方面可能比不上之前的版本,想要从事开发等工作的可以下载安装版本。3.下载完成之后需要在电脑-属性-高级系统设置里边配置环境变量,新建环境变量,将和所在的根目录直接粘贴复制进去。原创 2022-09-26 20:02:20 · 804 阅读 · 1 评论