123的博客

技术小白

Python练习(四)

Python练习(四) 1.矩阵转置,输入一个4行5列的矩阵并转置 a = [] #行数控制 for i in range(4): a.append([]) #列数控制 for j in range(5): print('第'+str(i+1)+'行,...

2019-06-14 11:46:39

阅读数 153

评论数 0

Python题目训练(三)

Python题目训练(三) 时间处理。输入一个时间字符串,返回下一个月的1号。 输入的时间格式包含两种:1. 2018.09.152.2018‑9‑15 func('2018.09.15') => '2018-10-01' func('2018-9-15') => ...

2019-05-30 14:19:26

阅读数 37

评论数 0

Python题目练习(二)

Python题目练习(二) 1. 要求:在不增加或修改任何print语句,且函数内只能增加一条语句的情况下,输出:"eric"。 1)只能修改f1()函数情况下,完成上述要求 name = 'lzl' def f1(): name = 'eric' ...

2019-05-30 13:54:36

阅读数 106

评论数 0

Python下载图片

Python下载图片 工具:Pycharm,Win10,Python3.6.4 这次就是一个很简单的案例,做一个图片爬虫。思路就是获取图片链接,然后下载图片,保存文件,模块代码如下。 # 根据图片链接下载 def download_image(img_url, i): print(...

2019-05-30 10:29:50

阅读数 23

评论数 0

安居客爬虫+分析+回归

安居客爬虫+分析+回归 工具:Pycharm,Win10,Python3.6.4 这次我们要做的是安居客西安地区房源爬虫,然后数据分析,并做一个简单的回归分析。 我们之前的爬虫和简单的数据分析已经说了很多了,这里我不再展开描述,我直接贴出结果。 以上就是分析的结果。接下来我们要...

2019-05-21 20:38:50

阅读数 84

评论数 0

SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the

SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentation: http://pandas.pydata...

2019-04-28 16:27:48

阅读数 45

评论数 0

Python pandas处理csv文件

Python pandas处理csv文件 工具:Pycharm,Win10,Python3.6.4 现有上面这样一份CSV文件,我们要对其做如下处理 1.第一列重新编序号从1开始 2.第三列数字0改成24 3.第三列之后的数据带小数的精度都设为小数点后一位 因为我们要对多个csv文...

2019-04-28 16:09:07

阅读数 77

评论数 0

Python 利用SVM,KNN,随机森林进行预测

Python 利用SVM,KNN,随机森林进行预测 工具:Pycharm,Win10,Python3.6.4 上图是我们的数据文件,最后一列是附近有无超市的标签,1代表有,-1代表没有。可以发现数据维度比较多,我通关计算相关系数提出相关性低的特征。 data = pd.read_exc...

2019-04-27 20:50:26

阅读数 219

评论数 0

Python 微博奔驰事件爬虫

Python微博奔驰事件爬虫 工具:Pycharm,Win10,Python3.6.4 最近奔驰漏油事件成为大家讨论的热点,也频上热搜。我就来做了一下微博评论爬虫,看看大家对这件事情的看法。 微博移动端相对好爬一些,且评论数据差不多,所以我们主要是针对微博移动端进行信息采集。 我们打开网址...

2019-04-27 17:09:42

阅读数 82

评论数 0

Python链家租房信息爬虫和高德地图展示

Python链家租房信息爬虫和高德地图展示 工具:Pycharm,Win10,Python3.6.4,高德API 1.数据爬取 首先我们明确要获取的信息。我们要北京的东城,西城,朝阳,海淀,丰台这5个地区的租房信息。打开链家租房网站,选择东城地区的第二页信息我们发现网址有如下规律 ...

2019-04-15 12:19:50

阅读数 104

评论数 0

LDA,Perceptron,SVM三种算法的sklearn简单使用

数据如下 x1 = [1,5,1.5,8,1,9] x2 = [2,8,1.8,8,0.6,11] y = [0,1,0,1,0,1] 预测[0.58,0.76] LDA算法 from sklearn.discriminant_analysis import LinearDiscri...

2019-04-15 10:30:01

阅读数 31

评论数 0

python 决策树使用

决策树使用 工具:Pycharm,win10,Python3.6.4 1.题目要求 根据如下数据使用决策树算法进行预测。 Roles Duration Audiobook Genre 5 80 no Action 15 120 yes Drama 15 100 yes Action 20...

2019-04-14 20:22:48

阅读数 22

评论数 0

python 朴素贝叶斯算法使用

朴素贝叶斯算法使用 工具:Pycharm,win10,Python3.6.4 1.题目要求 根据如下数据使用朴素贝叶斯算法进行预测。 Document Content Category d1 ball goal c...

2019-04-13 20:58:05

阅读数 22

评论数 0

python KNN算法使用

KNN算法使用 工具:Pycharm,win10,Python3.6.4 1.题目要求 现有数据如下,根据一些属性,选出适合向客户提供广告的方式,使用KNN算法,K为3. Age m/f Sales Channel 20 f 10 E-mail 30 m 90 Phone 40 m 70...

2019-04-13 19:54:34

阅读数 12

评论数 0

Python题目练习

Python题目练习 1.输入成绩,高于80优秀,60~80通过,低于60不及格 mark=int(input("mark:")) print(["Fail","Pass","Good"][(mark&g...

2019-04-13 16:43:03

阅读数 150

评论数 3

Python 网页节点统计

Python 网页节点统计 工具:Pycharm,win10,Python3.6.4 1.需求分析 我们现在有一个文件夹wp,里面包含了下图的子文件夹,每个文件夹里面又包含了网页,每个网页可能指向其他网页。总计有5000多个网页。我们要构建一个网络图统计每个网页的出度,入度。 2.实现...

2019-04-13 16:31:58

阅读数 36

评论数 0

爬虫时多种类信息写入

爬虫时多种类信息写入 爬虫时,我们一般会确定我们要哪些信息然后写入文件中。但有时候遇到如下情况,我们需要的信息有a,b,c,d,e,f,g,h。这8个信息,但是在第一个页面中只有a,b,c,d这四个信息,第二个页面中有c,d,e,f,h这4个信息,但我们写入文件的时候要求是如下格式: a ...

2019-03-12 19:25:51

阅读数 39

评论数 0

pd.read_csv()报错:OSError: Initializing from file failed

pd.read_csv()报错:OSError: Initializing from file failed 最近在读取csv文件的时候出现了OSError: Initializing from file failed这个报错,后来查阅资料知道是文件名中出现了中文。后来查看pandas源码才知道...

2019-03-09 20:39:44

阅读数 53

评论数 0

携程车次信息爬虫

携程车次信息爬虫 工具:Pycharm,win10,Python3.6.4 1.需求分析 今天我们要爬取携程a上面的车次信息,只爬取直达的班次。我们需要的信息如下 我们以昆山到苏州为例,要获取如下信息,我们查看网页源码发现这些信息并不存在网页源码中。打开开发者工具,点击XHR,我们可以...

2019-02-28 20:10:41

阅读数 167

评论数 4

高德地图爬虫

高德地图爬虫 工具:Pycharm,win10,Python3.6.4 1.需求分析 这篇爬虫和上一篇百度地图爬虫要求一样,百度地图爬虫我发现有一个auth参数会一直变化,一旦变化则获取的数据是不准确的,所以我上高德地图看了一下,高德地图没有这个反爬机制。但是高德地图大概爬取120个页面就会...

2019-02-27 11:11:13

阅读数 417

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭