自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 【课程作业】数据挖掘之具有定性变量的回归模型

具有定性变量的回归模型 作业要求

2020-05-14 07:43:00 217 0

原创 【课程作业】GIS设计与开发之MySQL、WebServie、调用环境云API

作业要求 安装数据库服务器RDBMS(如MySQL),在数据库中创建一个数据表,录入一些示例数据用于实验 编写一个WebService,实现读/写数据表的功能(Python/C#...) 利用jQuery JavaScript,编写一个WebApp程序,调用自己编写的WebService,实...

2020-05-11 10:00:25 100 0

原创 爬虫

京东商品(正常运行) import requests url='https://item.jd.com/100004286349.html' try: r=requests.get(url) r.raise_for_status()#状态码,返回200则对 ...

2020-03-26 16:06:43 61 0

原创 【课程作业】数据挖掘之主成分分析

参考:https://blog.csdn.net/lswbjtu/article/details/72764141 http://www.360doc.com/content/14/1103/09/17553313_422099670.shtml http://muchong.com/t-90...

2020-03-25 19:25:28 165 0

原创 【课程笔记】空间数据挖掘方法(机器学习)

一、绪论 机器学习VS数据挖掘 分类的过程 二、模型评估 评估方法 评估模型之留出法:简单粗暴,直接按2:1~4:1将数据集分为训练集:测试集。 评估模型之交叉验证法:将数据集分为k个互斥子集,一部分作为训练集,另一部分作为测试集,循环这个过程。常令k=10,进行十...

2020-03-20 19:30:50 86 0

原创 【Python】100基础例(51-100)+数据分析例

互访

2020-03-09 10:48:01 96 0

原创 【ArcGIS】制图综合小实战

设置图层透明度 符号方向随河流流向而变 插入小缩略图(数据框) 经纬网调整(切换中英文:ArcGIS Administrator-高级)

2019-12-23 21:47:36 66 0

原创 【NLP】LDA笔记之模型评估

Reference Number of topics Plexity OR maximum likelihood estimation 使用R语言进行主题发现:https://www.cnblogs.com/deeplearningfans/p/4114892.html 要在数据集中确...

2019-11-20 16:04:49 292 1

转载 【NLP】LDA笔记

参考 【NLP】LDA主题模型详解 【NLP】LDA主题模型的简单应用 主题模型简介 主题模型(Topic Model)是用来在一系列文档中发现 抽象主题 的一种统计模型(自动分析每个文档,统计文档中的词语,根据统计的信息判断当前文档包含哪些主题以及各个主题所占比)。直观来讲...

2019-11-15 14:09:04 158 0

原创 【NLP】LDA2Vec笔记(基于Lda2vec-Tensorflow-master 可实现)(实践)

数据 源代码所用数据:20_newsgroups.txt,大小几十MB。 文件开头:以texts换行,作为Key 源代码所用的20个新闻组数据(据观察,数据无特殊格式) 个人尝试之Japan.txt,成功。 所用Japan.txt数据 个人尝试之China.txt,失败。(load_2...

2019-11-14 09:34:50 611 1

原创 【Python】100基础例(1-50)+数据分析例

1:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少? #题目:有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少? #程序分析:可填在百位、十位、个位的数字都是1、2、3、4。组成所有的排列后再去 掉不满足条件的排列。 #个人:1、个位/十位/百位...

2019-11-12 11:20:41 127 0

原创 【NLP】Word2Vec笔记(代码)

参考 word2vec源码详解(非Python) Word2Vec的参数解释 word2vector从参数解释到实战 参数解释 from gensim.models import Word2Vec #下面的参数均是默认值 Word2Vec(sentences=None, #se...

2019-11-10 15:19:38 72 0

原创 【Python】菜鸟自编代码之旅

合并不同文件夹的同名.csv文件 bb 1)懵:舍友求助,我的第一反应是——同不会(不是经常学Python吗?这么简单的问题,你怎么好意思说不会?)。最后达成共识:第二天思考思考,试着实现。2)搜:作为一名伸手党,第一步当然是上网搜,最好有现成的代码啊哈哈哈!然而,并没找到。木得关系,虽然没有...

2019-11-10 10:09:55 36 0

原创 【前端JS】网页折线图数据下载——EChart.js初涉

网站一 任务描述 下载网页折线图中的数据 注:这并非普通的静态图表,像是传说中的Echart——基于JavaScript语言编写的前端数据可视化插件。 网页Echart图表截图 思考尝试 手动整理:对于我等懒人来说,能动手就不想动脑。第一反应当然是:手动移鼠标,人工整理数据。2...

2019-11-07 19:49:32 419 0

原创 【NLP】spaCy笔记

参考 快速掌握spacy在python中进行自然语言处理(附代码&链接) spaCy 第一篇:核心类型 spaCy 第二篇:语言模型 spaCy 第三篇:依存分析 spaCy官方文档 简介 基本介绍 spaCy的架构 spaCy 是一个号称...

2019-11-05 15:09:14 259 8

原创 【Python库】Pandas(部分)

目录 参考 简介 Numpy 和 Pandas 有什么不同 详介 Pandas数据结构之Series 从ndarray创建一个系列Series 从字典创建一个系列 从标量创建一个系列 使用标签检索数据(索引) 使用索引标签值列表检索多个元素 Pandas数据结构之DataFr...

2019-11-04 19:36:07 44 0

原创 【Python库】Numpy(较完整)

目录 参考 简介 详介 Ndarray 对象 NumPy 数据类型 NumPy 数组属性 Numpy的数组类ndarray的重要函数 NumPy 创建数组 numpy.empty numpy.zeros numpy.ones NumPy 从已有的数组创建数组 numpy....

2019-11-03 14:38:28 210 0

原创 【Python】像计算机科学家一样思考Python_笔记(下)(面向对象编程)

目录 (十五)类和对象 类 实例 复制 调试 术语 (十六)类和函数 (十七)类和方法 打印对象(附:重要例子) Time类 print_time函数 Time类 print_time方法 __init__方法 __str__方法 接口和实现 (十八)继承 类属性/...

2019-11-02 21:10:46 68 0

原创 【Python】像计算机科学家一样思考Python_笔记(上)

目录 (一)程序之道 (二)变量、表达式和语句 (三)函数 例:turtle模块,画正方形 有返回值的函数 重构 (四)函数接口 文档字符串 (五)条件和递归 pass 嵌套条件 递归recursion 键盘输入 (八)字符串序列(sequence) 遍历字符串 字...

2019-11-02 12:26:24 130 0

原创 【NLP】spaCy笔记

目录 参考 spaCy实践 语法方面 准备工作 展示全部词例(token) 只对前10个词例(token),输出token的索引值、词元、词性等 不再考虑全部词性,只关注文本中出现的实体(entity)词汇 把一段文字拆解为语句(按.分隔) 搞清其中每一个词例(token)之间的...

2019-11-01 11:18:07 146 0

原创 【NLP】预训练词向量

玩转词向量:用fastText预训练向量做个智能小程序 我没有训练任何机器学习模型,而是下载了使用 fastText 库创造的预训练英语词向量:https://fasttext.cc/docs/en/english-vectors.html。这些向量是在英语文本上训练的,但和人类不一样,这个学习...

2019-10-30 13:44:40 119 0

原创 【NLP】LDA2Vec笔记(基于cemoody/lda2vec 未实现)

学习链接:https://blog.csdn.net/u010161379/article/details/51250109 目录 说明 理论 __init__.py 简介 修改+注释后代码 corpus.py 简介 preprocess.py 准备工作 定义tokenize...

2019-10-30 08:46:04 953 1

原创 【NLP】Word2Vec笔记(理论)

视频课/大神笔记的“学后感” 笔记类 线上GPU:https://www.floydhub.com/ Google's trained Word2Vec model in Python tensorflow如何正确加载预训练词向量 各种预训练的词向量(Pretrained ...

2019-10-29 11:14:05 56 0

原创 【Python】异常/断言_菜鸟教程

Python3 assert(断言)|菜鸟教程:https://www.runoob.com/python3/python3-assert.html assert(断言)用于判断一个表达式,在表达式条件为 false 的时候触发异常 assert 1==1 # 条件为 true 正...

2019-10-27 18:59:30 169 0

原创 【Python】函数_菜鸟教程

Python3函数 |菜鸟编程:https://www.runoob.com/python3/python3-function.html 理论 return [表达式]结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None 实践 func() 简例 ...

2019-10-27 18:46:30 186 0

原创 【Python】模块_菜鸟教程

Python3 模块|菜鸟教程:https://www.runoob.com/python3/python3-module.html Python中Class类与def函数的区别(都用于封装) python导入模块中类的方法 模块VS库VS包 模块是一个包含所有你定义的函数和变量的文件,其...

2019-10-27 16:57:31 57 0

原创 【Python】面向对象_菜鸟教程

目录 理论 面向对象语言的基本特征 名词解释 实践 创建类的一般形式 简例引入 __init__() self 创建实例对象(类的实例化) 访问对象的属性 简例完整代码 Python内置类属性 类的继承 类属性与方法 类的私有属性 类的方法 类的私有方法 Pyt...

2019-10-27 15:47:45 167 0

原创 【随记】负能量80%+正能量20%

最近几天,不愿学习。究其原因——学了也不会,还是一样地菜。 有时,心里的小天使在提醒我:文凭并不菜呀,比周围很多人更厉害一点! 但我并不这样认为呀。经常觉得自己什么都不会,我所“积累”的理论/实践,估计真正厉害的人分分钟就能整明白。 既然学了也不会,那为何要学呢?反正也是白学,因为我最菜。英...

2019-10-27 14:39:22 54 0

原创 【Python】2019年二级书编程练习(第七章 文件和数据格式化 简例+习题)

#第7章 文件和数据格式化 打开-操作-关闭 #二进制文件VS文本文件 最主要的区别:是否有统一的字符编码(二进制文件无统一的字符编码,只能当作字节流,不能看作字符串) #采用文本方式读入文件,文件经编码形成字符串,打印出有含义的字符(一个字符由多个字节表示);采用二进制方式打开文件,文件被解析...

2019-10-26 21:01:54 420 0

原创 【Python】2019年二级书编程练习(第六章 组合数据类型 简例+习题)

#第6章:组合数据类型(能表示多个数据的类型) #序列类型:如字符串、列表和元组( ) #集合类型 { }:数据无序而不重复,可用于去重 #映射类型:如字典,键和值一一对应,每个元素是一个键值对 #集合类型是一个具体的数据类型名称,而序列和映射类型是一类总称 #遍历输出,并设定print()的...

2019-10-26 16:02:16 329 0

原创 【Python】2019年二级书编程练习(第五章 函数和代码复用 简例+习题)

【Python】2019年二级书编程练习(第五章 函数和代码复用 简例+习题)

2019-10-26 11:04:49 454 0

原创 【Python】改BUG之旅

近日重装了系统,虽说大多文件得以幸存,但arcGIS、PyCharm等常用软件以及各种环境变量,仍需重新配置。 昨晚,决定以牺牲少许准确率为代价,换取实验速度的显著提升(省事儿)。于是,开始了一通胡乱操作: ①怀着轻松的心情打开PyCharm,试图不加任何修改直接运行原程序。当然,以bug(环...

2019-10-21 09:35:18 72 0

原创 【NLP】英文数据预处理__词频统计简例

注:此处使用Gensim包处理后的“data_lemmatized”(再经简单处理)作为词频统计的输入数据“features” import collections features=['kansai', 'electric', 'back&#...

2019-10-16 22:04:52 328 0

原创 【NLP】英文数据预处理___Gensim(tf-idf LDA)

文本特征提取方法+基于Gensim的词袋处理/TFIDF处理

2019-10-15 19:35:13 491 0

原创 【NLP】英文数据预处理___Gensim(doc2bow LDA)

目录 理论 主流NLP包的区别 代码 准备工作之引入包、数据 预处理之大小写转换 预处理之去特殊符号 预处理之去停用词 预处理之词性标注+词形还原 建模之文本向量化(doc2bow) 建模之LDA 结果 all_code 思考 参考(有删改) 理论 主流NLP包的区...

2019-10-15 10:38:42 524 0

原创 【NLP】英文数据预处理___词干/词元处理

词形还原(Lemmatization)与词干提取(Stemming)的简介+异同点+Python实现代码

2019-10-12 19:01:27 168 0

原创 【Python_爬虫】地图POI(待完成)

#高德POI #-*-coding:utf-8-* import requests import json def coords(city): url = 'https://restapi.amap.com/v3/geocode/geo' # 输入API问号前固定...

2019-09-22 13:22:46 244 0

原创 【Python】文件读写

在Python中,文件读写是通过open()函数打开的文件对象完成的。使用with语句操作文件IO是个好习惯。 #读取文件的全部内容_通用模式 f=open('D:\新桌面\Python\爬虫\exercise\sanwen.txt','r',e...

2019-09-12 10:23:56 24 0

原创 【Python_NLP】gensim与DTM

注:本文=多篇文章精华提炼+个人总结 参考博客出处: 链接:https://blog.csdn.net/l7H9JA4/article/details/80220939 作者:李雪冬 编辑:李雪冬 https://blog.csdn.net/qq_42988748/article/detai...

2019-08-21 10:05:13 793 0

转载 【ML】超参数/超参数优化

博客园@yif25 https://www.cnblogs.com/yifdu25/p/8202811.html 什么是超参数 所谓超参数,就是机器学习模型里面的框架参数,。在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。比如聚类方法里面类的个数,或者话题模型里面话题的个数等等...

2019-08-06 15:50:26 114 0

提示
确定要删除当前文章?
取消 删除