- 博客(13)
- 资源 (1)
- 收藏
- 关注
原创 爬下某car之家数据,透视下各个价格区间的车系
写一个获取各个车系数据的方法,然后循环遍历各个品牌下的车系,将所有车系的数据存到excel表,代码爬取完所有品牌的车系后,会把数据保存到本地生成excel文件。然后插入透视图, 勾选最低价后,行标签下找到一行,右键选择创建组,然后输入起始、终止价格和步长,最后可以找到各个价格区间的车系,再一辆一辆去比对。为了按价格进行透视,需要把指导价中的万字去掉,Ctrl + H 替换万字。首先是从某car之家的首页找到各个获取所有品牌的接口。然后把各个品牌及其对应的url存成一个字典。
2023-04-19 00:52:41 477
原创 自然数a、b,较大数除以较小数,余数为a▽b,用代码来解题的思路
一道小学数学题,看似很简单,解题思路却并不简单。通过python代码遍历出结果,辅助解答
2023-01-06 20:39:03 297
原创 报表比对常用excel方法
1、 求字符串长度,len函数边界值测试中,如果字符串长度为100,一个一个数字符串太不IT了,最快捷的方法就是用excel的len函数,或是python的len()函数。excel:python:2、 Lenb函数Lenb 函数是按字节计算的,而len计算的是字符串的长度。lenb,半角状态下输入的数字、字母、英文、标点符号每个字符按1计数的,汉字和全角状态下的标点符号每个字符按2计数;而len中英文字符都是每个字符按1计数Lenb结合len函数提取单元格中头或尾为中文的内容或数字
2022-05-04 14:05:04 1093
原创 pandas+groupby对南京二手房进行数据可视化及大图显示
一、利用python的requests 库爬取链家二手房数据链家南京二手房url地址:'https://nj.lianjia.com/ershoufang/'按区查的话,比如鼓楼区,那么url就是'https://nj.lianjia.com/ershoufang/gulou/'查看发现南京11个区里面,高淳房源太少,所以本次爬虫没有爬取高淳区的。观察链家网站的页面发现最多显示100页的内容,所以本次爬取数据每个区爬取了100页,3000条数左右进行分析及可视化。调用url获取到的.
2022-03-13 20:31:27 3519 3
原创 MaaS出行即服务简单介绍
云计算有IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)、DaaS(数据即服务)的概念,如今在欧洲诞生了一个叫MaaS的理念,翻译过来译为出行即服务。MaaS介绍先看看今天的出行方式,我们现在有网约车,有共享单车,公交地铁。想去某个地方,打开手机地图,输入目的地,各种路线就规划出来了,有自驾、有公共交通。眼下这些方式,有时候给人的出行体验并不是很好,比如跟朋友有约,但目的地距离较远,又是晚高峰,准时到就不能打车,容易堵在路上,选择公共交通又要换乘好几次,可能就不能准时赴约。
2022-02-27 10:00:06 3634
原创 python 爬取七普人口并展示人口区间的概率分布
爬虫常用的库:requests,beautifulsoup,urllib2,scrapy等,本次主要用requests库以及正则表达式提取关键信息。正态分布有一个非常重要的性质:在特定条件下,大量统计独立的随机变量的和的分布趋于正态分布,这就是中心极限定理。为了验证中心极限定律,想着爬取七普人口,统计各个人口范围区间内的城市数量,观察直方图,结果查了好多网站也没找到现成的人口数量,最后最后在买购网上看到有按省份给出的地市人口数量。但是各个省份的人口需要点击进去查看,而且少了新疆的人口。打开F12
2022-02-20 12:45:34 2668 2
原创 大学物理之毕奥·萨伐尔定律推导
毕奥·萨伐尔定律其中是从电流元指向参考点方向的单位矢量,是真空磁导率。电流元产生的磁场的磁感应强度垂直与组成的平面,并满足右手螺旋定则。电流元定义:为电流元。大小为,的方向由线元所在处电流的流向来确定。目的:用积分法来求出任意形状的磁场分布。电流元的磁场大小:载流直导线的磁场长为的载流直导线,其中电流为,计算距离直导线为的点的磁感应强度。涉及到的数学公式磁感应强度的积分推导所以:无限长载流直导线则,扩展知识...
2022-02-13 12:11:22 10836 2
原创 爬取《水门桥》电影评论生成可视化数据及词云
一、爬取电影评论壬寅年春节贺岁电影《长津湖-水门桥》,为了分析这部剧的各项数据,用爬虫的方法从猫眼上爬取了4万多条电影评论。1、为了防止地址被禁,使用了代理地址池进行爬取:设置代理地址方法,可以从如下几个免费网站获取代理地址开放代理 - 快代理免费代理ip_服务器http代理_最新ip代理_免费ip提取网站_国内外代理_66免费代理ip89免费代理IP - 完全免费的优质HTTP代理IP供应平台云代理 - 高品质http代理ip供应平台/每天分享大量免费代理IP我..
2022-02-06 18:19:12 4240 5
原创 用rand(7)构造rand(10)
某大厂面试题。通过rand(7)函数生成rand(10)函数。根据rand函数均匀分布的特点,用python代码验证正确和错误解题思路的结果。
2022-02-03 16:36:54 2279
原创 利用牛顿迭代法求平方根
泰勒公式:如果我要计算a的平方根,计算的结果为x,根据上面的泰勒公式可以如下处理:根据牛顿迭代法,随便取一个值x0,带入上式计算得到的结果为x1,x1带入得到的结果为x2,依次迭代,当xi和xi+1足够接近时,就是计算的结果。用下面的代码进行迭代计算,就能得出想要的结果。讲完了原理,下面就用python实现# -*- coding: utf-8 -*-import numpy as npimport matplotlib as mplimport matplotlib.p.
2022-01-27 23:34:14 2710
原创 数据可视化查看2021全国各省份的GDP
1、首先是获取内陆31个省市的GDP数据2、利用pandas工具读取数据,用bar图把各省份GDP排名排列出来data = pd.read_excel('全国GDP.xlsx')data = pd.DataFrame(data)province = data["省份"]gdp = data["2021年GDP"]bar = Bar()bar.add_xaxis(province.values.tolist())bar.add_yaxis("", gdp.values.toli
2022-01-26 23:48:41 7513 4
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人