自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_43458484的博客

原创 python excel数据导入与导出

虽然很简单，但是总是容易忘记。。。。。import pandas as pddata=pd.read_excel("C:/Users/Administrator/Desktop/bb.xlsx") ###读入数据data.head()data12.to_excel('C:/Users/Administrator/Desktop/aaab.xlsx') ####导出数据

2020-07-14 10:58:27 570

原创 Python爬取两个城市之间的直线距离

因需要爬取江浙沪皖地级市之间的城市距离，爬取的网址是http://www.china6636.com/。爬取代码如下：###江浙沪皖41城市代号x=[27005208,27017237,27029767,27035786,27036716,27071629,27044783,27115330,27045424,27060216, 27060379,27059992,27065633,27085865,27074128,27017808,27071103,27045640,27003122,2701

2020-05-28 15:47:53 1791

原创 python爬取2345天气网上2011年-2018年历史天气

由于学业需要，本文利用python爬取2345历史天气，爬取年份为2011年到2018年，由于网页格式以及自身编程水平有限，本文分成四个部分爬取2011~2018的历史天气，分别为：2011-2015年，201年1-2月，2016年3-12月，2017年以后。本文爬取的地区是江浙沪皖地区的历史天气。首先为2011年-2015年的天气代码如下：#####多个城市循环爬取###输入待查城市代号city0=[58362,58343,58141,58044,58238,58259,58357,58246,5

2020-05-27 15:54:18 1650 2

原创 ArcGIS从全国县界中提取江浙沪皖地级市图——续上一篇（提取县界图那篇）

由于

2020-05-27 11:17:18 2643 2

原创 ArcGIS从全国县界中提取江浙沪皖县界图

在实际应用中，我们通常会根据自己的研究需要裁定特定的县界图，比如我需要江浙沪皖的县界图，但是通常只能找到全国县界图，以前我都是去淘宝上花钱买，最近因为时间充裕，自己研究了一下，发现很简单，下面把制作做法分享给大家。...

2020-05-27 08:40:40 6049

转载机器学习常见算法概述

注：本文为转载，原创文章连接如下：（非常非常感谢博主大大！！！）https://blog.csdn.net/a819825294/article/details/52275798 原创机器学习常见算法概述 ...

2019-11-25 16:59:21 237

原创 python爬取新浪新闻——以新车为例

爬取新浪新闻时，主题词不同，网页格式也不一样，故在此选用“新车”为主题，爬取新浪新闻的标题、发布时间、链接、具体内容以及发布作者爬取网址：http://auto.sina.com.cn/newcar/index.d.html爬取代码如下：####爬取新闻标题、发布时间、新闻链接import requestsfrom bs4 import BeautifulSoupimport urll...

2019-11-01 16:05:21 424

原创 python爬取ZOL桌面壁纸图片

最近迷上了爬虫，看了一丢丢视频学习之后，开始实战，爬取图片地址：http://desk.zol.com.cn/循环爬取“风景”图片，实现代码如下：from urllib import request,errorimport rekey_name=request.quote("fengjing")##定义函数，将爬到的每一页的商品url写入到文件def savefile(data):...

2019-11-01 09:32:20 805 1

原创决策树算法及应用

1、划分选择1.1信息增益样本集合D中第k类样本所占的比例为pk（k=1,2,……|y|），则D的信息熵定义为：Enter（D）越小，D的纯度越高。离散属性a有V个可能取值：v个分支节点包含D中所有在a上取值为a^V 的样本，记为D ^V,则信息增益定义为：信息增益越大，利用属性a进行划分的纯度提升就越大，ID3算法就是根据信息增益为准则来选择划分属性。1.2增益率信息增益...

2019-10-31 14:59:05 1206

原创自然语言处理之序列标注（一）

隐马尔可夫模型与序列标注1、序列标注问题序列标注问题指的是给定一个序列x=x1x2……xn，找出序列中每个元素对应标签y=y1y2……yn的问题。最简单的，输入一个自然数序列，输出他们的奇偶性，按序列排成另一个序列。这时标注集为{奇，偶}，标注过程如下：![在1.1序列标注与中文分词{B，M，E，S}法——B（Begin）、E（End）分别表示词语首尾；M（Middle）表示词中；S（S...

2019-10-30 09:15:03 2231

原创 pynlpir分词库报错解决办法

最近使用pynlpir分词库时，遇到了如下的报错：百度之后发现是license问题，很多百度回答都是去github上下载新的license，由于本人比较蠢，去官网上逛了很久，一直找不到下载选项，很久很久之后终于找到下载选项，但是文件太大，半天都没下载下来，emmmm……，后来经过不懈尝试，终于找到正确的下载网址：https://github.com/NLPIR-team/NLPIR/tree/...

2019-10-18 15:18:08 454

原创 python调用百度API正向、逆向解析地址

1、输入地址，获取经纬度#####读取数据import pandas as pddata=pd.read_excel('address.xlsx')data.head(5)#####创建列表z_level=[0 for i in range(0,len(data.address))]z_precise=[0 for i in range(0,len(data.address))]...

2019-10-18 14:35:54 545

转载机器学习目录

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。 ...

2019-10-17 10:29:29 132

原创 python去重、根据某列统计另一列频数

python去重、根据某列统计另一列频数假如有如下格式的数据，实现两个操作：（1）根据“ABC”列去重；（2）根据"jd"列统计“cun”代码如下：（1）去重data1=data.drop_duplicates('ABC') # 删除掉重复的行，在原值上直接修改len(data1)data1.to_excel('data1.xlsx')data1.head(10)结果：...

2019-10-16 21:17:22 4349 1

原创 ARCGIS绘制全国各省PM2.5浓度图操作步骤

ArcGIS新手小白一枚，经常需要帮助老师绘制一些简单的空间图，利用ArcGIS绘制全国各省的pm2.5浓度图，简单又方便，不记下来会忘记~

2019-10-16 15:31:30 17249 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除