- 博客(11)
- 资源 (8)
- 收藏
- 关注
原创 SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the
SettingWithCopyWarning:A value is trying to be set on a copy of a slice from a DataFrameSee the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-vie...
2019-04-28 16:27:48 1055
原创 Python pandas处理csv文件
Python pandas处理csv文件工具:Pycharm,Win10,Python3.6.4现有上面这样一份CSV文件,我们要对其做如下处理1.第一列重新编序号从1开始2.第三列数字0改成243.第三列之后的数据带小数的精度都设为小数点后一位因为我们要对多个csv文件处理,所以事先把多个csv文件放在一个文件夹中,循环读取每个文件并对每个文件做以上处理。1.重新...
2019-04-28 16:09:07 2785
原创 Python 利用SVM,KNN,随机森林进行预测
Python 利用SVM,KNN,随机森林进行预测工具:Pycharm,Win10,Python3.6.4上图是我们的数据文件,最后一列是附近有无超市的标签,1代表有,-1代表没有。可以发现数据维度比较多,我通关计算相关系数提出相关性低的特征。data = pd.read_excel('data.xls')# print(data)column = data.columns....
2019-04-27 20:50:26 15794 9
原创 Python 微博奔驰事件爬虫
Python微博奔驰事件爬虫工具:Pycharm,Win10,Python3.6.4最近奔驰漏油事件成为大家讨论的热点,也频上热搜。我就来做了一下微博评论爬虫,看看大家对这件事情的看法。微博移动端相对好爬一些,且评论数据差不多,所以我们主要是针对微博移动端进行信息采集。我们打开网址看到如下信息评论量还是挺多的,所以我们要先获取该微博的链接,然后通过该微博去获取评论页。可以看...
2019-04-27 17:09:42 627
原创 Python链家租房信息爬虫和高德地图展示
Python链家租房信息爬虫和高德地图展示工具:Pycharm,Win10,Python3.6.4,高德API1.数据爬取首先我们明确要获取的信息。我们要北京的东城,西城,朝阳,海淀,丰台这5个地区的租房信息。打开链家租房网站,选择东城地区的第二页信息我们发现网址有如下规律下面就是分析页面,以东城为例,我们发现数据直接在源代码中,很简单,直接正则或者xpath获取即可。...
2019-04-15 12:19:50 2573 13
原创 LDA,Perceptron,SVM三种算法的sklearn简单使用
数据如下x1 = [1,5,1.5,8,1,9]x2 = [2,8,1.8,8,0.6,11]y = [0,1,0,1,0,1]预测[0.58,0.76]LDA算法from sklearn.discriminant_analysis import LinearDiscriminantAnalysisimport numpy as nptrain_x = np.arra...
2019-04-15 10:30:01 719
原创 python 决策树使用
决策树使用工具:Pycharm,win10,Python3.6.41.题目要求根据如下数据使用决策树算法进行预测。Roles Duration Audiobook Genre5 80 no Action15 120 yes Drama15 100 yes Action20 80 no Drama5 80 no Action12 115 yes ?2 180 yes ...
2019-04-14 20:22:48 426
原创 python 朴素贝叶斯算法使用
朴素贝叶斯算法使用工具:Pycharm,win10,Python3.6.41.题目要求根据如下数据使用朴素贝叶斯算法进行预测。Document Content Categoryd1 ball goal cart goal...
2019-04-13 20:58:05 1229
原创 python KNN算法使用
KNN算法使用工具:Pycharm,win10,Python3.6.41.题目要求现有数据如下,根据一些属性,选出适合向客户提供广告的方式,使用KNN算法,K为3.Age m/f Sales Channel20 f 10 E-mail30 m 90 Phone40 m 70 Post60 f 100 Phone20 m 30 E-mail30 f 40 E-mail...
2019-04-13 19:54:34 756
原创 Python题目练习
Python题目练习1.输入成绩,高于80优秀,60~80通过,低于60不及格mark=int(input("mark:"))print(["Fail","Pass","Good"][(mark>=60)+(mark>=80)])#输出成绩等级这是我没有见过的一种思路,特此记录一下,Python中True就是1,False就是02.输入如下图片结果for...
2019-04-13 16:43:03 1596 3
原创 Python 网页节点统计
Python 网页节点统计工具:Pycharm,win10,Python3.6.41.需求分析我们现在有一个文件夹wp,里面包含了下图的子文件夹,每个文件夹里面又包含了网页,每个网页可能指向其他网页。总计有5000多个网页。我们要构建一个网络图统计每个网页的出度,入度。2.实现代码以第一个文件里面的第一个网页为例,我们要如何获取这个网页包含了哪些子链接。获取第一个网页,打开...
2019-04-13 16:31:58 487
基于PCA的人脸识别程序
2018-01-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人