Python
文章平均质量分 81
各式各样的python程序、练习
欢迎交流学习!
Infinity343
一只科研狗
展开
-
pandas数据处理实例(箱线图)
因为要按月绘制图像,所以我们将月份和年份提取出来,作为时间标识。接下来就可以通过循环来绘制箱线图,其中需要注意的是,每个站点存在数据的月份可能不同,这时就可以通过已经提取出来的月份标识来识别包含数据的最大月份。绘制每个公司的月度箱线图(其中需要满足排放量>1),并给出简要的描述统计结果。通过读取站点名称,可以与数据集中的样本相对应,从而区别出不同站点的箱线图。将数据分为两个部分,一个是全体数据集data, 另一个是站点名称。原创 2023-03-10 22:25:27 · 1145 阅读 · 1 评论 -
分位数回归的求解
分位数回归实际上是一种特殊的ℓ1\ell_1ℓ1回归问题,特别地,当所求分位数τ=0.5\tau=0.5τ=0.5时就是中位数回归。一般的,线性回归问题可以写为ℓp\ell_pℓp范数线性回归,简称为ℓp\ell_pℓp回归:arg minx∈Rn∣∣Ax−b∣∣p\argmin_{x\in\mathbb{R}^n}||\boldsymbol{A}\boldsymbol{x}-\boldsymbol{b}||_px∈Rnargmin∣∣Ax−b∣∣p其中A∈Rm×n,b∈Rm\bolds原创 2022-09-27 12:38:54 · 3846 阅读 · 2 评论 -
某网站内容获取
简单小练习原创 2021-11-04 14:11:40 · 1033 阅读 · 6 评论 -
经验分布与真实分布
经验分布函数定义设(x1,x2,⋯ ,xn)(x_1,x_2,\cdots,x_n)(x1,x2,⋯,xn)是取自分布为F(x)F(x)F(x)的母体中一个简单随机子样的观测值. 若把子样观测值由小到大进行排列, 得到x(1)≤x(2)≤⋯≤x(n)x_{(1)}\leq x_{(2)}\leq\cdots\leq x_{(n)}x(1)≤x(2)≤⋯≤x(n), 这里x(1)x_{(1)}x(1)是子样观测值(x1,x2,⋯ ,xn)(x_1,x_2,\cdots,x_n)(x1,x原创 2021-09-11 23:48:04 · 3973 阅读 · 0 评论 -
Python梯度下降法
线性(回归)模型梯度下降算法是机器学习中最常见的数值型算法之一, 本文分别从统计学和机器学习的角度来谈到梯度下降法的理论与应用.从统计学的角度来看, 线性回归模型的一般矩阵形式为:Y^n×1=E(Y∣X)=Xn×(p+1)θ(p+1)×1\hat{Y}_{n\times1}=E(Y|X)=X_{n\times(p+1)} \theta_{(p+1)\times 1} Y^n×1=E(Y∣X)=Xn×(p+1)θ(p+1)×1其中nnn是样本量, ppp通常会说是自变量(或协变量)个数, XX原创 2021-03-05 17:19:25 · 545 阅读 · 3 评论 -
利用Python爬取京东商品的一种办法
前言如今的京东、淘宝、天猫等等已经不同往日了, 在用户不登录的情况下, 很难通过技术手段来大规模获取到我们关注的商品信息. 关于京东等购物网站的自动登录也有很多人在做, 但是大厂的反爬能力确实很强, 目前能查阅到的自动登录技术基本都过时了. 本文干脆跳过这一过程, 换一个思路.在不登录的情况下获取商品的编号我们登录京东的网址jd.com后可以在不登录的情况下直接搜索商品, 比如搜索手机可以看到, 其实这一页面就已经列出商品的名称, 售价, 评价量等等. 遗憾的是这个页面的内容不能直接爬取, 但是原创 2020-11-22 20:14:10 · 4580 阅读 · 11 评论 -
网络爬虫学记(一)Requests库
Requests库入门实例:京东商品信息爬取import requeststry: r = requests.get('https://item.jd.com/100003717483.html') r.encoding = r.apparent_encoding r.status_code print(r.text[:1000])except : print("Error")...原创 2019-07-29 18:52:31 · 223 阅读 · 0 评论 -
Python学记(十五)程序设计方法学(中)
程序设计方法学day7.20计算思维与程序设计计算思维与程序设计计算生态与Python语言用户体验与软件产品第三方库安装看见更大的Python世界第三方库的pip安装方法...原创 2019-07-20 19:46:09 · 178 阅读 · 0 评论 -
Python学记(十六)程序设计方法学(下)
程序设计方法学tip:第八章终于结了。。os库的使用路径操作os.path子库以path为入口,用于操作和处理文件路径import os.pathimport os.path as op进程管理环境参数第三方库自动安装脚本话不多说,直接上代码import oslibs = {"numpy","matplotlib","pillow","sklearn",...原创 2019-07-21 19:21:59 · 157 阅读 · 0 评论 -
Python学记(终章)Python计算生态(上)
Python计算生态从数据处理到人工智能Numpy数据分析库数据可视化文本处理机器学习霍兰德人格分析雷达图从Web解析到网络空间网络爬虫Web信息提取Web网站开发网络应用开发...原创 2019-07-22 21:48:42 · 199 阅读 · 0 评论 -
Python学记(终章)Python计算生态(下)
Python计算生态2019.7.26 :end从人机交互到艺术设计Python库之图形用户界面Python库之游戏开发Python库之虚拟现实Python库之图形艺术玫瑰花绘制...原创 2019-07-26 20:15:43 · 251 阅读 · 0 评论 -
Python学记(十四)程序设计方法学(上)
程序设计方法学day2019.7.18体育竞技分析高手过招,胜负只在毫厘之间自顶向下将一个总问题表达为若干个小问题组成的形式,使用同样方法进一步分解小问题 ,直至每一小问题可以利用计算机明了的解决自底向上# 第一阶段def main(): printIntro() probA, probB, n = getInputs() winsA, winsB = simNGa...原创 2019-07-18 23:57:37 · 177 阅读 · 0 评论 -
Python学记(十三)文件和数据格式化(下)
文件和数据格式化二维数据的格式化和处理二维数据的表示列表类型可以表达二维数据CSV数据存储格式CSV:Comma-Separated Values这是一种国际通用的二维数据存储格式,一般以.csv扩展名,每行一个一维数据,采用逗号分隔,无空行如果某个元素缺失,逗号仍要保留;二维数据的表头可以作为数据存储,也可以另行存储;逗号为英文半角符号,逗号与数据之间无额外的空格...原创 2019-07-16 17:56:39 · 188 阅读 · 0 评论 -
Python学记(七)程序控制结构(下)
程序结构控制程序的循环结构遍历循环遍历某个结构形成的循环运行方式for <循环变量> in <遍历结构> : <语句块>计数循环(遍历的一种)遍历由range()函数产生的数字序列,产生循环for i in range(N) : <语句块> for i in range(M,N,K) : #(M到N(不包括),步长为K)...原创 2019-05-20 02:29:16 · 592 阅读 · 0 评论 -
python学记(五)数据类型(下)
2019.5.14数据类型字符串类型及操作字符串由0个或多个字符组成的有序字符序列可以用双引号和单引号表示,但仅表示单行字符串。第一位置为0,最后一个位置是-1三个单引号由一对三单引号或三双引号表示,可表示多行字符串‘’‘Python语言tips:’’'并不是原生的多行注释。字符串的序号正向递增序号和反向递减序号字符串的使用使用[]获取字符串中的一个或...原创 2019-05-15 19:13:47 · 251 阅读 · 0 评论 -
Python学记(八)程序和代码复用(上)
2019.5.20函数和代码复用函数的定义与使用函数的理解与定义函数是一段代码的表示def <函数名>(<参数(0个或多个)>) : <函数体> return <返回值>##计算n!def fact(n) : s = 1 for i in range(1, n+1): s *= i return s 函数是一段...原创 2019-05-21 00:41:42 · 930 阅读 · 0 评论 -
在Python123的学习笔记
菜鸟上路~,记录一下自己的学习过程Day 2019.5.11 SaturdayPython开发环境的配置就不记录于此了。(还有什么语言比它更具有兼容性吗?)基础知识阶段变量变量:一个变量存储一个值。比如说:>>> T = "Hello World''>>> print(T)T就是Python语言中的变量,它的值是唯一的,可以通过input(...原创 2019-05-11 00:44:29 · 1480 阅读 · 0 评论 -
Python学记(十一)组合数据类型(下)
5.24组合数据类型字典类型及操作字典类型定义映射:映射是一种键(索引)和值(数据)的对应["python", 123, ",io"] 0 1 2# 这是序列的默认索引,映射类型则由用户将数据定义为索引 字典类型是"映射"的体现键值对:键是数据索引的扩展字典是键值对的集合,键值对之间无序采用大括号{}和dict()创建,键值对用冒号表示{&...原创 2019-05-25 00:32:08 · 221 阅读 · 0 评论 -
Python学记(三)turtle库
获得用户输入的一个整数,参考该整数值,打印输出"Hello World",要求:如果输入值是0,直接输出"Hello World"...原创 2019-05-12 18:21:05 · 8735 阅读 · 0 评论 -
Python学记(六)程序控制结构(上)
day2019.5.16程序的控制结构程序的分支结构单分支结构根据判断条件结果而选择不同向前路径的运行方式ifif <条件>: <语句块> ##true or false举例guess = eval(input())if guess == 99: print("猜对了) 二分支结构根据判断条件结果而选择不同向前路径的运行方式if &l...原创 2019-05-16 23:40:42 · 284 阅读 · 0 评论 -
Python学记(九)函数和代码复用(下)
day 2019.5.22函数和代码复用代码复用与函数递归代码复用与模块化设计代码复用把代码当成资源进行抽象代码资源化:程序代码是一种用来表达计算的"资源"代码抽象化:使用函数等方法对代码赋予更高级别的定义代码复用:同一份代码在需要时可以被重复使用模块化设计分而治之:通过函数或对象封装程序划分为模块及模块间的表达紧耦合 松耦合紧耦合:两个部分之间交流很多,无法独立存在松...原创 2019-05-23 01:14:51 · 306 阅读 · 0 评论 -
Python学记(十)组合数据类型(上)
5.23组合数据类型集合类型及操作集合类型定义集合是多个元素的无序组合。与数学中的集合概念一致。集合元素之间无序且不可更改,不能是可变数据类型set() #创建集合,集合用{}表示>>> A = set("123124sdfsdf")>>> A{'d', '1', 's', 'f', '2', '4', '3'}集合操作符...原创 2019-05-24 00:39:55 · 203 阅读 · 0 评论 -
Python学记(十二)文件和数据格式化(上)
文件和数据可视化2019.7.11##好久没学了,赶紧拾起来文件的使用文件的类型文件是数据的抽象和集合。本质上讲,所有的文件都是以二进制的方式进行存储,但在形式上,所有文件都采用两种方式展示,即:文本文件和二进制文件。文本文件:由单一特定编码组成的文件(UTF-8),也可以看做是长字符串,例如:.txt、.py文件等二进制文件:直接由比特0和1组成,没有统一编码,一般存在二进制0和...原创 2019-07-15 23:32:18 · 220 阅读 · 0 评论 -
Python学记(四)数据类型(上)
Day 2019.5.13数据类型数字类型及操作整数类型(integer)可正可负,没有取值范围限制例如:pow(x,y) ##计算x^y>>> pow(2,100)1267650600228229401496703205376四种进制1.十进制2.二进制3.八进制4.十六进制浮点数类型(real number)与数学中的实数概念一致...原创 2019-05-13 20:28:54 · 210 阅读 · 1 评论