Other-数学建模存档
文章平均质量分 95
记录大学时期参加数学建模的经历
TIM33470348
著有《Python数据分析:从小白到专家》一书。于2021年5月,由电子工业出版社和工信出版集团出版,是一本正式发行的图书,ISBN-13:9787121409233。
这本书能够面市,得感谢这么多年来,在我前进道路上一直陪伴我的亲人和好友,以及赏识我的各位长辈,老师和大佬们。尤其是在我低落的时候,仍然陪伴我,鼓励我,没有放弃我的挚友。
展开
-
2022年美赛C题M奖思路复盘(附代码、附论文)
前言美赛已经结束4天了,一直忙于教资考试的准备,今天我终于抽空写了这篇C题思路复盘的博客。题目大致要求题目叫'Trading Strategies(交易策略)',一共给了两个文件,分别是比特币和黄金价格随时间变化的CSV文件。大致要求可以分为以下四个步骤:基于截止至当日的价格情况建立模型,预测2021年9月10日原来的本金1000美元会变成多少钱?(Develop a model that gives the best daily trading strategy based only on原创 2022-02-26 15:51:58 · 19292 阅读 · 7 评论 -
用scrapy爬取Kelly Blue Book二手车网数据
这是我以前的一篇博文:数学建模用/Python爬虫实战——爬取Kelley Blue Book(KBB二手车交易网站)的交易信息这是我在去年数学建模校赛时候写的一个爬虫,用来获得数据分析需要的数据信息。这一次不同与上一次,上一次使用的beautifulsoup和正则匹配来获取数据,这一次使用的是css和xpath选择器,且是基于scrapy框架的。这是爬取的要求: 这一次实现了翻页功能,代码如下所示:items.py:...原创 2020-07-17 08:58:57 · 741 阅读 · 0 评论 -
一次奇遇——再谈简单的二元线性回归
虽然我已经写过一篇关于线性回归的博文了https://blog.csdn.net/qq_41938259/article/details/98758305,但是这次“朝花夕拾”也是源于一个偶然的巧合。说来可能比较玄幻,有一个人在CSDN博客上私聊了问,询问我愿不愿意写书,我想了下欣然同意了。毕竟要是可以出版的话,对自己来说不仅是对这么多年努力的一种肯定,而且对于考研二面,还有就业面试,增添了一个沉...原创 2019-10-12 15:56:00 · 218 阅读 · 0 评论 -
数学建模用/Python爬虫实战——爬取Kelley Blue Book(KBB二手车交易网站)的交易信息
首先这是本次建模的题目: 于是我们先用chrome查看网页源码,还好比较简单是静态页面:在cars for sale 这边选择Used,右键“网页查视网页源码”:如图黄色荧光笔显示的分别是二手出售价格,品牌,里程,型号。是我们需要且可以找到的。可以看到这些东西包含在script标签下,属性是application/ld+json(这里...原创 2019-08-14 21:36:10 · 1483 阅读 · 0 评论 -
数学建模——一些基本概念(线性回归)和相对应的python代码实现
首先分析一下我们需要什么:我们需要解决什么数学问题?这个问题该用什么模型? 找到一个模型使用的区别准则。这是根据1来讲的,这句话的意思,是用于体现不同模型与实际未知模型有多少偏差的准则。 同时做出预测时也要有一个判定的准则(标准)。关键是具体该怎么做?这上面三个问题对应了以下三个步骤:按照一个或一些选出的模型类型对数据进行拟合 从一些已经拟合的类型中选取最适合的模型。 根据模型...原创 2019-08-07 17:16:47 · 1415 阅读 · 1 评论 -
数学建模——用于模型评估的几个概念(纯概念)
查准率与查全率查准率,就是所有预测结果中正确值所占的比例。而查全率则是实际结果中被预测到的值所占的比例。这样讲,为免太抽象,所以就用这么一张图来演示,以居民收入普查为例,要预测收入大于定于5万的人:设接受普查的居民为全集;1+2为真实值的集合;2+3是预测值的集合:查准率越高,命中的真确结果个数越多,预测准确性越高 。查全率越高,预测的完整性越高。为了用于表示以上这些东西,我们定义了...原创 2019-08-08 21:21:22 · 2282 阅读 · 0 评论 -
python巨蟒之一Numpy(3)————矩阵初始化,矩阵加减乘运算
本文主要讲随机矩阵的初始化,还有矩阵的加减乘:矩阵初始化数据:1)将矩阵所有数据初始化为0,这里以一个3行5列的矩阵为例:np.zeros((3,5))2)将矩阵所有数据初始化为int类型的数字1,这里以一个3行5列的矩阵为例:np.ones((3,5),dtype=np.int64)用随机数填充矩阵:from numpy import random...原创 2019-07-16 20:11:24 · 1360 阅读 · 0 评论 -
python巨蟒之二——pandas基本操作(CSV文件处理)
pandas作为python的一个常用库,主要用于数据的处理。比如数据的读取和整理。引入pandas模块:import pandas as pdcsv文件是什么?逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解...原创 2019-07-18 12:18:00 · 693 阅读 · 0 评论 -
python巨蟒之一Numpy(2)————数据的读入与切片运算以及数值比较
本文讲解numpy数据的读入与切片运算以及数值比较。npData=np.genfromtxt("1.txt",delimiter=",",dtype=str)这一句使用了genfromtxt函数,从txt文档读入数据并转化为矩阵,并存放在npData这个矩阵里。读取的文件名为1.txt,分隔符是逗号“,”最后都用str类型来存放。str类型是可以转化为int或者float类型的。...原创 2019-07-15 22:10:54 · 377 阅读 · 0 评论 -
python巨蟒之一Numpy(1)————矩阵基本操作
本文介绍numpy的矩阵使用及其矩阵计算的基本操作,主要是矩阵的初始化,等及各种查看等。import numpy as np这一段是numpy的引入,也是最基本的一条语句。将numpy简写为np也是业界的共识。print(help(np.array))这一句打印了numpy矩阵的说明文档。print是打印,而help则是显示帮助文档的必要语句。array即是numpy矩阵...原创 2019-07-15 21:05:36 · 236 阅读 · 0 评论 -
数学建模—用numpy和matplotlib进行线性拟合
上次博文爬取了excel的数据但是回头一看却发现忘记把列表里的字符串转化为float,这里着重讲一下,为什么不转化为int:应为pow()这样的函数不能传入int所以干脆转化为float。这是上次博问的链接:https://blog.csdn.net/qq_41938259/article/details/94495114先给出将列表里的字符串转化为float的算法:nn=[]fo...原创 2019-07-04 19:31:31 · 5505 阅读 · 0 评论 -
最小二乘法的拟合(数学建模第三版)
就是备个份,方便自己以后查阅:原创 2019-07-03 13:38:00 · 5087 阅读 · 0 评论 -
数学建模
确定性系数和相关系数线性回归预测是通过一组统计观测数据确定最优拟合线性关系, 但我们需要对这种关系拟合的效果好坏进行评判,这种评判通常称为模型检验。评判的结论将直接影响人们对线性回归模型的信任程度,从而也影响对预测结果的信 任程度。评判的标准主要是拟合的误差,如果拟合误差比较小,拟合效果就好,预测结果的信任程度就高。如果拟合误差较大,拟合效果就不太好,严重时还必须重 新考察历史数据、选择...转载 2018-08-08 09:41:51 · 5198 阅读 · 0 评论 -
python爬取excel并用正则表达式将utf-8转化为数字
这次数学建模的题目是要分析两张表格,当然数学建模不是重点,本篇博文的重点是如何从两张excel里爬取数据并加以分析的过程,首先便是爬虫。我们要爬取两张表格里的数据,这次用到了pandas模块。pip install pandaspip install xrld有人会疑惑:“第二行是什么意思呢?”因为爬虫只能爬取老的office excel,即以xls为后缀的文件。而现在的新的off...原创 2019-07-02 23:12:39 · 1306 阅读 · 0 评论