- 博客(21)
- 资源 (17)
- 收藏
- 关注
原创 第九届“泰迪杯”数据挖掘挑战赛C题-建模思路参考
明白甲方要什么• 1.吸引顾客,稳定客源• 2.发现竞争优势• 3.游客满意度以及影响因素这三者的关系• 1是最终目的,是核心• 23是1的路径研究• 2与3先导我们有什么?项目Value2个附件景区和酒店的评论 数据(示例数据和比赛数据);景区和酒店的评分样表;关键词样表1个C题详细说明__要解决的问题?• 1景区及酒店印象分析• 2景区及酒店综合评价• 3网评文本的有效性分析• 4景区及酒店的特色分析1景区及酒店印象分析• 初步构思关
2021-04-29 22:18:46 9151 27
原创 【自然语言处理-2】word2vec词嵌入算法“男人”+“女人”=“爱情的坟墓”
词嵌入算法通俗易懂的理解:词嵌入算法就是使用一个低维度的向量来表示一个词,并且距离相近的向量在实际的词含义上也是相近的。比如:“男人”的向量与“女人”向量的距离,相比“男人”向量与“游戏”向量的距离,谁更近?对我来说,“电子竞技不存在爱情”,所以后者的距离比前者更近。*“男人词向量”+“女人词向量”≈“爱情的坟墓” “男人词向量”+“女人词向量”\approx“爱情的坟墓” “男人词向量”+“女人词向量”≈“爱情的坟墓”这使得词向量具有数据运算功能。独热编码那么问题来了,词语怎么怎么转换
2021-04-29 17:13:20 703
原创 【自然语言处理-1】TF-IDF简单最实用的关键词提取技术
自然语言处理历史阶段时间发展意义早期阶段1956 年以前香农曾提出过概率模型来描述语言,乔姆斯基提出了基于规则的上下文无关文法。阶段还没有太明确的产出,只有一些简单的拼凑快速发展1957-1970两大派别分别从概率模型和规则模型分别进行了深入的研究,使用规则构建机器翻译已经小有成效瓶颈期1971-1993研究停滞,产出的隐马尔科夫模型(HMM)再次爆发1994 年之后运力设备提升,互联网崛起,飞速发展TF-IDFTF-IDF(Term fre
2021-04-29 15:52:44 1360
原创 unable to read local cache ‘C:\\Users\\kingS/gensim-data\\information.json‘ during fallback, connec
1.复制该段代码{ "corpora": { "semeval-2016-2017-task3-subtaskBC": { "num_records": -1, "record_format": "dict", "file_size": 6344358, "reader_code": "https://github.com/RaRe-Technologies/gensim-data/re
2021-04-29 15:29:57 2339 4
原创 【爬虫学习笔记】一文讲清楚爬虫
什么是爬虫分类为什么要用python写爬虫条件文章目录什么是爬虫分类为什么要用python写爬虫条件一、协议在这里插入图片描述二、抓包工具的使用网络请求三、urllib库四、参数编码与解码五、urlparse和urlsplit的用法六、Request类七、ProxyHandler处理器(代理设置)八、cookie九、自动登录访问授权十、信息的加载和保存十一、request库十二、resquest处理cookie处理SSL证书一、协议二、抓包工具的使用网络请求
2021-04-29 01:06:17 147
原创 【白嫖系列-怕违规】告别BDWP龟速下载,体验飞一般的感觉
需求工具IDM下载神器 【传送门】数码小站-网盘在线解析【网站传送门】案例演示论文排版神器LaTeX,软件+模板+教程1链接:https://pan.baidu.com/s/1RZiSLwncDwYDWYOZRD7p4A 提取码: bwvh复制链接到提交注:这里建站解析的大神设置了验证码,需要小伙伴们加群才能使用解析完成在IDM下更改UA设置在下载-选项 里,将UA代理设置为LogStatistic,点击确定保存IDM下载鼠标右键-复试链接在IDM下新建任务效果
2021-04-28 12:50:19 2852
转载 【转载】用MATLAB计算空间权重矩阵【反距离和经济距离嵌套矩阵】
直接扣代码打开即食,方便简单%主要应用了matlab的distance函数。%计算30个省区市行标准化后的地理空间权重矩阵 W。要计算别的,更改以下的30为对应数字即可%{选中下面两行,按F9快捷键新建纬度x和经度y矩阵x=[] %x为纬度,按列粘贴y=[] %y为经度,按列粘贴%}x = [40.4826.3543.4538.2723.0822.4820.0229.5930.436.0436.3834.1729.3925.04]y = [111.41106
2021-04-25 10:51:55 3778
原创 BDWK免费下载白嫖指南【1s搞定】
工具http://www.html22.com/zh/缺点不能下载那种试看几页的文档下载下来是整个网页,需要手动将其他无关内容删除食用方式第一步:复制要下载的链接url第二步:粘贴到点击开始下载,然后等待几分钟即可总结:不用下载其他软件,网页直接操作还是蛮简单的如果不会,打开F12,审查元素,一个一个复制也是可以的!...
2021-04-25 10:46:01 2502
原创 机器学习最经典算法-SVM支持向量机-【基本解读算法+详细实际案例分部流程】
支持向量机(SVM)SVM算法可谓是最经典的机器学习算法了,具有泛化错误率低,分类速度快,结果易解释等特点多多,在应用领域涉及非常广,比如人像识别 、文本分类 、手写字符识别、人脸识别、生物信息学等等等,同时算法模型评估效果也是很优秀的,它为何这么优秀?实际背后其实是数学凸优化问题,即:局部最优解,一定是全局最优解【不好理解!】,你可以类比于高中线性优化问题的直线的平移问题【肤浅的理解】有兴趣可以参考这篇文章【传送门】支持向量机要解决的问题假设有这么些点,画条线,把它们分成两堆!很easy!一维:
2021-04-21 01:48:54 3686 2
原创 论文查重率【降重】从65%-25%的心路历程!超硬核!霸道降重!
开端的查重率为61%使用工具论文降重助手下载地址:【传送门】提取码:u778下载安装使用方法请参照我的另一篇博文!【传送门】开始翻译啦!其实我觉得有点用,但是用处不是特别的大,可能是我的论文是关于政府政策性的因素,改的乱七八遭的!这玩意!看起高大上,实则RBN!那咋办呢?被动句便把字句,一句一句的啃下来呗!还没有这玩意来得快和直接一些。敲重点!!!我使用的方法是:一句一句啃,将查重率高的句子,复制到百度,检索。换词汇、换表达。总之,有一点点与原文不一样就行!改多改少看能
2021-04-16 16:05:45 1042 1
原创 翻译法降重助手使用说明
感谢公众号【计算机物语】,欢迎关注该博主大人!打开 百度翻译开发平台,点击 登录,然后登陆你的百度(百度云)账号登录成功后点击 管理控制台选择 个人开发者,并且填写相关信息,然后点 下一步这里 不用填写信息,选择 暂不认证点击 开通服务选择 通用翻译API,点击 下一步点击 开通标准版应用名称随便填一个即可,其它信息不用填写,勾选 我已知晓通用翻译API计费规则,点击 确认开通点击 前往管理控制台点击 开发者信息把你的 APPID 和 密钥 记下来,就完成注册了
2021-04-16 14:49:10 2175 2
原创 数值特征
离散值处理import pandas as pdimport numpy as npvg_df = pd.read_csv('datasets/vgsales.csv', encoding = "ISO-8859-1")vg_df[['Name', 'Platform', 'Year', 'Genre', 'Publisher']].iloc[1:7] Name Platform Year Genre
2021-04-16 00:47:34 203 1
原创 C盘清理-我的C盘莫名其妙就满了?-继续整-删除C盘的系统文件!!
情况是这么个情况实际操作来了右键C盘属性磁盘清理清理系统文件这里有5.12G的系统文件!不用说了,我不要了,我要空间!勾选直接删了!
2021-04-14 00:36:40 888
原创 惊呆了!这个视频压缩工具太强大了叭!!一键压制降维打击,体积小、无损画质!
上链接旧版-传送门1-够用了新版-传送门2-没必要-钥匙:提取码:74l8使用方法打开即食界面长这样其余的默认即可,你又不是专业的,我也不是,听话!最多调一下CRF值,这个值,越小视频内存越大,你看着来,推荐10-30范围调节救小姐姐开始了!!!!!鸣谢一拨 大神!感谢分享!!!!...
2021-04-13 23:56:51 221
原创 学术神器EndNote快速入门指南
下载安装下载地址:传送门先点击绿化工具,安装几秒钟,箭头两个中文版和英文版,看喜好,添加桌面快捷方式注:如果遇到EndNote没有嵌入word请参照大神【传送门】特别的提示就是一定是管理员运行搞定新建库和认识工作面板区域文件->新建->【新建库,建议不要到C盘】C盘满了请看我的其他文章,关于解决C盘满了的问题导入选择PDF文件位置,但是呢,一般导入进去是空的????从本地导入文献,感觉不好使呀!!在线导入文献——从CNKI文献搜索勾选自己想看的文章导出为
2021-04-13 17:07:32 498
转载 最实用的pandas函数总结——案例结合
导入库import pandas as pd导入数据的7种方法pd.DataFrame() # 自己创建数据框,用于练习pd.read_csv(filename) # 从CSV⽂件导⼊数据pd.read_table(filename) # 从限定分隔符的⽂本⽂件导⼊数据pd.read_excel(filename) # 从Excel⽂件导⼊数据pd.read_sql(query,connection_object) # 从SQL表/库导⼊数据pd.read_json(json_s
2021-04-12 22:55:01 166
原创 神经网络ANN算法——鸢尾花案例python实现
个人对神经网络的理解神经网络算法,是一个黑匣子,当你传入一些数据,并告诉它最终要达到的目标,整个神经网络就开始学习。但是,我们很难知道里面究竟发生了什么,也没有数学来严格推导和证明黑匣子这玩意不可控啊!人脑人在刚出生的时候有 2000 亿的脑细胞,且细胞不会再生,当然你也不用担心会用完,100岁衰减都还有27亿。神经元包含了轴突和树突,树突负责接收信号、轴突负责发送信号。人的大脑是很好记忆、逻辑、运算、推理的设备。算法原理假设有一个最简单的神经系统构成:一层输入单元和一层输出单元,我们根据已
2021-04-11 14:57:38 9449 5
原创 【初学】神经网络概述
神经网络的6个基本模型感知机(Perceptron)1.它是最简单的神经网络。2.它有两层【输入层+输出层】没有隐藏层,不能执行过复杂的任务参考:https://zhuanlan.zhihu.com/p/49191769多层感知机(MPL)完全连接网络,每一个神经元都连接到相邻层中的所有神经元。具有更高的处理能力也容易出现过拟合处理过拟合:提前终止、添加缀学层(参考)、添加正则化卷积神经网络(CNN)作用:通常用来做计算机视觉识别,如面部识别、人脸检测、物体识别、手写信件识别、医
2021-04-08 15:28:20 216
原创 SymPy: name ‘symbols‘ is not defined[解决]
源代码是这个样子x = x0, x1, x2, l = sympy.symbols("x_0, x_1, x_2, lambda")f = x0 * x1 * x2g = 2 * (x0 * x1 + x1 * x2 + x2 * x0)- 1L = f + l * ggrad_L = [sympy.diff(L, x_) for x_ in x]sols = sympy.solve(grad_L)sols# 求解结果中负值舍去g.subs(sols[0])# 0f.subs(sols
2021-04-07 16:44:49 4938
转载 解决“连到系统上的设备没有发挥作用”+苹果手机传输到windows系统的视频文件
https://jingyan.baidu.com/article/8275fc86df214c07a03cf697.html
2021-04-03 17:28:00 1081
基于MATLAB实现的随机前沿模型代码【含固定效应】案例+实验数据
2023-12-24
基于R语言实现SCI绘图模版(代码+示例数据)
2023-11-24
基于R语言实现的TOPSIS修正的熵值法,资料附赠灰色关联度计算程序
2023-06-06
混合改进蚁群算法matlab源程序
2023-04-21
sata17勿商用附安装步骤,三步走So easy
2023-04-18
缺失值处理-基于随机森林算法的缺失值处理方法
2023-04-17
莫兰指数检验的代码-基于matlab的实现
2023-04-17
第九届“泰迪杯”数据挖掘挑战赛C题数据,景区和酒店的评论 数据(示例数据和比赛数据);景区和酒店的评分样表;关键词样表
2023-04-10
ODSFMFO基于死亡机制的飞蛾火焰优化和改进的全局优化任务的火焰生成机制
2023-03-05
基于死亡机制的改进火焰飞蛾扑火算法
2023-03-05
你好汽车人:大黄蜂视频测试与提取工具
2022-07-04
鲸鱼优化算法 ,包含主程序与作图程序以及实验函数
2022-06-07
心电信号特征值提取ECG
2022-06-07
蚁群算法是一个功能强大的优化算法,分享混合改进蚁群算法 Matlab 程序代码;基于混沌的改进蚁群算法
2022-06-07
基于R语言实现的线性样条+B样条+N-W核估计+最近邻估计+局部多项式【有数据+有代码+有图】
2022-04-13
Matlab8种经典的优化算法【遗传+差分进化+免疫+蚁群+粒子群+模拟退火+BP神经网络】
2022-04-08
空间计量,模型估计方法,包含常见的很多诸如空间滞后、空间误差、杜宾模型等,以及一些扩展的方法,针对截面数据,附原始数据。
2022-03-03
空间计量,空间权重矩阵的MATLAB代码实现,附原始数据
2022-03-03
RVM和SBL压缩包.rar
2021-10-12
GA-BP+PSO-BP+RAS+LSTM+BSO天牛群算法+随机森林.rar
2021-05-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人