- 博客(11)
- 收藏
- 关注
原创 数据分析笔记03 Numpy统计分析
Numpy统计分析一.数据读写1.(二进制)保存文件2.(二进制)读取文件生成的文件如下:‘============================================================================’文本文件读写3.保存为txt文件,并导出保存的文件如下:二、简单数据分析1.排序代码及运行结果:2.间接排序代码实现:3.重复/去重代码实现:...
2021-10-23 09:29:52 126
原创 数据分析笔记02 Numpy矩阵以及通用函数
一、Numpy矩阵1.创建矩阵 合成矩阵代码实现:2.矩阵运算数组运算与矩阵运算的对比:二、通用函数
2021-10-21 21:03:30 132
原创 数据分析笔记01 Numpy ndarray的使用、os模块
Numpy ndarray的使用对文件进行处理,首先要调用os模块import os1.熟悉ndarray的使用具体代码及运行结果:其他修改、创建的方法:具体代码以及实现:3.数组的数据类型数据类型转换:代码实现:4.生成随机数生成随机数的函数都在random子模块下常用函数如下:其他函数:5.数组的索引、变换6.数组展平ravel可以直接横向展平,但是flatten可以提供参数实现横向纵向展平代码及运行结果:7.数组的组合8.切割
2021-10-21 20:10:38 121
原创 python爬虫实战学习--泰迪笔记3
第四模块 常规动态网页爬取4.1 概述静态网页:完全可以直接获取网页源代码动态网页:网络信息是动态的,无法直接提取。主流的两种方法:4.2 逆向分析爬取动态网页核心:跟踪操作行为,提取有价值的信息,进行合理调动具体步骤如下:代码实现:4.3.1 Selenium打开浏览对象安装下载selenium库和浏览器补丁1.sekenium安装:如下图:...
2021-10-08 19:43:54 477
原创 python爬虫实战基础--泰迪笔记2
静态网页爬取3.1 静态网页爬取概述3.2 使用urllib3实现HTTP请求代码如下:2.头处理代码如下:3.timeout:防止网络不稳定 设置timeout参数代码实现:4.重试代码实现:5.完整HTTP请求:代码实现:3.3 使用requests库实现HTTP请求requests简介代码如下(luogu不让俺看查看状态码和编码 返回值为概率较大的编码方式,故不一定准确)实现编码如下:请求头、响应头处理代码实现:timeout
2021-10-08 19:37:21 322
原创 python爬虫基础知识 --泰迪学习笔记
python爬虫基础知识1.1 python网络爬虫实战介绍爬虫:网页、客户端信息提取认识爬虫、反爬虫、配置爬虫环境1.2 认识爬虫浏览器获取反应内容,从而获取网页数据爬虫实际上是上述流程的模拟网络爬虫:也称为网络蜘蛛、网络机器人,是一个自动下载网页的计算机程序或自动化脚本。像一只蜘蛛在互联网上沿着URL的丝线爬行,下载每一个URL所指向的网页,分析页面内容。分类:1.通用网络爬虫2.聚焦网络爬虫3.增量式网络爬虫合法性与robots协议1.3 认识反爬虫反爬虫的
2021-04-29 00:27:47 397 2
原创 python编程基础 二
第四模块 字符串、字典(本文的大部分干货、笔记以及注意事项都在代码中注释)4.1字符串 索引 切片字符串相当于定义一段字符序列。字符串中的元素不可变。代码如下:#字符串string1 = 'wz'string2 = "wz"#单引号和双引号均不可以实现多行字符串定义print (string2)#wzstring3 = '''wz''' #三引号可以实现多行字符串的定义print(string3)#打印出w//z#多行注释 选中后按CTRL+?键#统一缩进 选中后按tab键#反
2021-04-11 17:53:29 233
原创 python程序设计基础
第一模块 准备工作1.1 认识python,并学习了python的优势及其组成部分1.2 搭建python环境。实际开发环境包含三部分:python解释器(程序运行基础)、第三方类库(功能拓展)、编译器(提高编译效率)。1.3 安装编译器PyCharm。1.4 学习PyCharm的使用方法,并完成并运行以下代码。第二模块 列表操作2.1 完成了第一个python程序如下:2.2 python固定数据类型基本数据类型完成了如下代码:2.3 列表构建及其索引列表:1.列表中每个
2021-04-03 17:54:00 5596 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人