自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

sdy的博客

https://github.com/linyhuan

  • 博客(25)
  • 资源 (1)
  • 问答 (2)
  • 收藏
  • 关注

原创 一招解决python pip install 安装库失败

PIP是python强大的安装利器,但是我们经常遇到安装库失败的问题,以下本人觉得最有效的解决方法:1.打开 https://www.lfd.uci.edu/~gohlke/pythonlibs网站,2.搜索(CTRL+F)需要安装的库的名称,比如pandas3.找到对应自己系统的版本并下载,cp后面的数字时python的版本,如cp36代表python3.6版本,WIN后面的数...

2018-10-25 10:22:55 89766 20

原创 python爬虫爬取京东店铺商品价格数据(更新版)

主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据##sqlalchemy :备用方案,上传数据到mysql以下是源代码:# -*- coding:utf-8 -*-import requestsimport reimport randomimport t...

2018-10-17 09:41:42 15398 8

原创 EXCEL 利用随机数公式生成随机字母、随机密码

1.随机生成一个大写字母:=CHAR(RAND()*26+65)2.随机生成一个小写字母:=CHAR(RAND()*26+97)3.随机生成6位数字=ROUND(RAND()*10^6,0)4.随机生成2位字母+6位数字的密码=CHAR(RAND()*26+97)&CHAR(RAND()*26+97)&(ROUND(RAND()*10^6,0))...

2018-10-12 12:44:59 30423 2

原创 EXCEL VBA批量下载URL链接地址图片、URL链接地址图片转为图片

在EXCEL里,需要大量引用网上链接图片,例如python的爬虫把图片链接爬取之后,需要在EXCEL内展示图片,可以使用VBA批量将URL链接地址图片转为图片;1.复制以下代码到VBA内,(不知道VBA是什么的传送门:https://blog.csdn.net/weixin_39416561/article/details/82428684)Sub 链接转图片()For Each R...

2018-09-06 09:35:08 24793 24

原创 Excel VBA 入门基础

VBA是一种宏语言,能完成许多重复繁琐的操作,使工作处理就会变得很高效。在office内WORD、Excel、PPT等都内置了VBA。以下主要讲Excel上的运用: 一、打开VBA方法:方法1:在Excel界面使用快捷键Alt+F11方法2:office2010版本以上:点击文件--选项--自定义功能区--自定义功能区--勾选开发工具--确定开启开发工具后就可以在主菜单上看...

2018-09-05 19:02:14 52854 2

原创 今日头条ajax技术内as ,cp,_cp_signature参数分析、破解及python爬取频道数据

相信很多人在爬今日头条的时候就遇到了一个难题,就是找到了消息头后,有3个加密的参数(as ,cp,_cp_signature),如下图:找到的请求URL是:https://www.toutiao.com/api/pc/feed/?max_behot_time=1535349295&category=__all__&utm_source=toutiao&widen...

2018-08-27 15:20:51 11911 58

原创 python爬虫爬取天猫店铺商品数据

#!coding=utf-8import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.packages.urllib3.di...

2018-08-27 13:50:35 11574 2

原创 python利用爬虫制作简单翻译软件

思路:通过抓取百度翻译的返回翻译结果。目标url:https://fanyi.baidu.com/sugimport requestsurl='https://fanyi.baidu.com/sug' ##请求url##请求头headers={ 'Host':'fanyi.baidu.com', 'Origin':'https://fanyi.baidu.com'...

2019-01-25 12:13:29 648

原创 python 爬取时光网电影票房数据

# -*- coding:UTF-8 -*-from bs4 import BeautifulSoupimport sysimport pandas as pdimport reimport requestsdef sgw(): s=requests.session() headers={ 'Accept':'*/*', 'Acce...

2019-01-16 10:57:35 3245

原创 python 爬取百度图片搜索结果图片

  #coding=utf-8import reimport requestsfrom urllib import errorfrom bs4 import BeautifulSoupimport osnum = 0numPicture = 0file = ''List = []def Find(url): global List print('...

2019-01-08 10:55:21 973

原创 python爬虫爬取前程无忧51job企业招聘信息

# -*- coding:utf-8 -*-import requestsimport reimport randomimport timeimport pandas as pdfrom bs4 import BeautifulSoupimport lxmlfrom requests.packages.urllib3.exceptions import InsecureRequ...

2019-01-07 14:40:36 2966

原创 python 爬虫 爬取 小米有品 全网 商品数据

#!coding=utf-8import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.packages.urllib3.d...

2018-12-22 12:05:58 3231

原创 python 通过腾讯地图API获取全国关键词(楼盘/商场)位置信息

到腾讯地图API官网https://lbs.qq.com/index.html 申请一张账号,申请开发者密钥(Key):申请密钥。 以下为搜索全国万达的地理位置信息#!coding=utf-8import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.e...

2018-12-18 10:19:47 3686

原创 EXCEL VBA 使用正则表达式清洗替换数据

在EXCEL表内遇到有规律性的数据需要提取或者替换时,比如在数据中提取时间,身份证号码等,EXCEL内自带的查找替换就难以实现,我们可以利用VBA适用正则表达式去对数据进行匹配。什么是正则表达式?正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规...

2018-12-08 10:10:51 15743 2

原创 python爬虫爬取今日头条APP数据(无需破解as ,cp,_cp_signature参数)

#!coding=utf-8import requestsimport reimport jsonimport mathimport randomimport timefrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.package...

2018-12-01 11:38:51 8841 8

原创 python 爬虫 爬取网易严选全网商品价格评论数据

1.获取商品目录在Chrome浏览器开发者工具中,可以找到目录的JS地址:http://you.163.com/xhr/globalinfo//queryTop.json 得到商品数据 def get_categoryList(): url='http://you.163.com/xhr/globalinfo//queryTop.json' ...

2018-11-26 15:33:07 2779 2

原创 python 弹窗提示警告框MessageBox

需要安装pywin32模块,pip install pywin32 ##pip install pywin32import win32api,win32con##提醒OK消息框win32api.MessageBox(0, "这是一个测试提醒OK消息框", "提醒",win32con.MB_OK)##是否信息框win32api.MessageBox(0, "这是一个测试是否信息...

2018-11-17 17:01:48 27642 2

原创 python 实现批量修改文件名

#!coding=utf-8import sysimport osdef replace_filename(file_path, var1, var2): for root, dirs, files in os.walk(file_path): for file_name in files: if var1 in file_name: ...

2018-11-17 16:39:43 2291

原创 pyhton爬虫 爬取电商平台商品历史价格、最低价格(慢慢买网)

主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据#!coding=utf-8import requestsimport osimport reimport jsonimport datetimeimport timeimport pandas as pd...

2018-11-10 10:23:11 13734 10

原创 python爬虫 爬取淘宝搜索页面商品信息数据

主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据以下是源代码:#!coding=utf-8import requestsimport reimport timeimport jsonfrom requests.packages.urllib3.except...

2018-10-11 16:37:03 10152 10

原创 python爬虫 爬取 豆瓣网 搜索结果 同城活动 数据

主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据bs4:网页代码解析以下是源代码:#!coding=utf-8import requestsimport reimport jsonfrom requests.packages.urllib3.excep...

2018-10-07 11:37:43 1320

原创 mysql增加序号删除字段重复记录保留重复数据中的第一条数据

数据库示例:表名:test.表名 根据学号字段删除重复的数据:1.给每一行设置行序号定义一个变量n,插入序号字段,每行n+1ALTER TABLE test.表名 ADD 序号 int NULL;set @n=0;update test.表名 set 序号=@n:=@n+1;2.汇总 学号 的第一个序号SELECT 序号 FROM test.表名 G...

2018-09-13 18:08:02 965

原创 python爬取京东店铺商品价格数据(已过期)

# -*- coding:utf-8 -*-import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.packages.ur...

2018-09-13 11:03:08 1667

原创 python建立IP代理池

#!coding=utf-8import requestsimport reimport pandas as pddef get_proxy(): """ 获取代理 """ # 获取xicidaili的高匿代理 ##proxy_info_list = [] # 抓取到的ip列表 ip_list=[] dk_list=[] ...

2018-08-27 15:54:23 2340 2

原创 python爬虫苏宁易购店铺商品数据爬取

苏宁易购店铺商品数据爬取#!coding=utf-8##苏宁易购店铺商品数据爬取import requestsimport reimport mathimport randomimport timefrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pd...

2018-08-24 15:04:41 6321 2

MYSQL 详细图文使用手册

MYSQL 超级详细图文基础教学使用手册 一、 前言 二、 MYSQL安装 1. 下载 2. 安装 三、 MYSQL 搭建 1. 设置环境变量 2. 设置开启外网权限 3. 连接数据库 4. 更改数据储存位置 四、 MYSQL创建数据库 1. MySQL Workbench 8.0 CE界面介绍 2. 创建数据库 3. 创建数据表 4. 插入数据 5. 查询数据 6. 删除数据 7. 修改数据 五、 使用python导入导出数据

2018-09-21

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除