自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 python excel数据导入与导出

虽然很简单,但是总是容易忘记。。。。。import pandas as pddata=pd.read_excel("C:/Users/Administrator/Desktop/bb.xlsx") ###读入数据data.head()data12.to_excel('C:/Users/Administrator/Desktop/aaab.xlsx') ####导出数据

2020-07-14 10:58:27 568

原创 Python爬取两个城市之间的直线距离

因需要爬取江浙沪皖地级市之间的城市距离,爬取的网址是http://www.china6636.com/。爬取代码如下:###江浙沪皖41城市代号x=[27005208,27017237,27029767,27035786,27036716,27071629,27044783,27115330,27045424,27060216, 27060379,27059992,27065633,27085865,27074128,27017808,27071103,27045640,27003122,2701

2020-05-28 15:47:53 1787

原创 python爬取2345天气网上2011年-2018年历史天气

由于学业需要,本文利用python爬取2345历史天气,爬取年份为2011年到2018年,由于网页格式以及自身编程水平有限,本文分成四个部分爬取2011~2018的历史天气,分别为:2011-2015年,201年1-2月,2016年3-12月,2017年以后。本文爬取的地区是江浙沪皖地区的历史天气。首先为2011年-2015年的天气代码如下:#####多个城市循环爬取###输入待查城市代号city0=[58362,58343,58141,58044,58238,58259,58357,58246,5

2020-05-27 15:54:18 1647 2

原创 ArcGIS从全国县界中提取江浙沪皖地级市图——续上一篇(提取县界图那篇)

由于

2020-05-27 11:17:18 2634 2

原创 ArcGIS从全国县界中提取江浙沪皖县界图

在实际应用中,我们通常会根据自己的研究需要裁定特定的县界图,比如我需要江浙沪皖的县界图,但是通常只能找到全国县界图,以前我都是去淘宝上花钱买,最近因为时间充裕,自己研究了一下,发现很简单,下面把制作做法分享给大家。...

2020-05-27 08:40:40 6041

转载 机器学习常见算法概述

注:本文为转载,原创文章连接如下:(非常非常感谢博主大大!!!)https://blog.csdn.net/a819825294/article/details/52275798 原创 机器学习常见算法概述 ...

2019-11-25 16:59:21 235

原创 python爬取新浪新闻——以新车为例

爬取新浪新闻时,主题词不同,网页格式也不一样,故在此选用“新车”为主题,爬取新浪新闻的标题、发布时间、链接、具体内容以及发布作者爬取网址:http://auto.sina.com.cn/newcar/index.d.html爬取代码如下:####爬取新闻标题、发布时间、新闻链接import requestsfrom bs4 import BeautifulSoupimport urll...

2019-11-01 16:05:21 423

原创 python爬取ZOL桌面壁纸图片

最近迷上了爬虫,看了一丢丢视频学习之后,开始实战,爬取图片地址:http://desk.zol.com.cn/循环爬取“风景”图片,实现代码如下:from urllib import request,errorimport rekey_name=request.quote("fengjing")##定义函数,将爬到的每一页的商品url写入到文件def savefile(data):...

2019-11-01 09:32:20 805 1

原创 决策树算法及应用

1、划分选择1.1信息增益样本集合D中第k类样本所占的比例为pk(k=1,2,……|y|),则D的信息熵定义为:Enter(D)越小,D的纯度越高。离散属性a有V个可能取值:v个分支节点包含D中所有在a上取值为a^V 的样本,记为D ^V,则信息增益定义为:信息增益越大,利用属性a进行划分的纯度提升就越大,ID3算法就是根据信息增益为准则来选择划分属性。1.2增益率信息增益...

2019-10-31 14:59:05 1203

原创 自然语言处理之序列标注(一)

隐马尔可夫模型与序列标注1、序列标注问题序列标注问题指的是给定一个序列x=x1x2……xn,找出序列中每个元素对应标签y=y1y2……yn的问题。最简单的,输入一个自然数序列,输出他们的奇偶性,按序列排成另一个序列。这时标注集为{奇,偶},标注过程如下:![在1.1序列标注与中文分词{B,M,E,S}法——B(Begin)、E(End)分别表示词语首尾;M(Middle)表示词中;S(S...

2019-10-30 09:15:03 2225

原创 pynlpir分词库报错解决办法

最近使用pynlpir分词库时,遇到了如下的报错:百度之后发现是license问题,很多百度回答都是去github上下载新的license,由于本人比较蠢,去官网上逛了很久,一直找不到下载选项,很久很久之后终于找到下载选项,但是文件太大,半天都没下载下来,emmmm……,后来经过不懈尝试,终于找到正确的下载网址:https://github.com/NLPIR-team/NLPIR/tree/...

2019-10-18 15:18:08 450

原创 python调用百度API正向、逆向解析地址

1、输入地址,获取经纬度#####读取数据import pandas as pddata=pd.read_excel('address.xlsx')data.head(5)#####创建列表z_level=[0 for i in range(0,len(data.address))]z_precise=[0 for i in range(0,len(data.address))]...

2019-10-18 14:35:54 543

转载 机器学习目录

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

2019-10-17 10:29:29 130

原创 python去重、根据某列统计另一列频数

python去重、根据某列统计另一列频数假如有如下格式的数据,实现两个操作:(1)根据“ABC”列去重;(2)根据"jd"列统计“cun”代码如下:(1)去重data1=data.drop_duplicates('ABC') # 删除掉重复的行,在原值上直接修改len(data1)data1.to_excel('data1.xlsx')data1.head(10)结果:...

2019-10-16 21:17:22 4345 1

原创 ARCGIS绘制全国各省PM2.5浓度图操作步骤

ArcGIS新手小白一枚,经常需要帮助老师绘制一些简单的空间图,利用ArcGIS绘制全国各省的pm2.5浓度图,简单又方便,不记下来会忘记~

2019-10-16 15:31:30 17222 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除