- 博客(27)
- 资源 (1)
- 收藏
- 关注
原创 硕士论文格式排版要点
呕心总结🤣是我太菜。1.前三页封面 插入连续分节符2.摘要目录 先插入页码罗马数字3.正文开始切断同前节 插入页码 阿拉伯数字4.摘要目录添加页眉 插入中部件 域名 样式引用 标题格式(你的标题是什么格式就引用什么格式)5.添加正文页眉先奇偶页不同再输入偶数页页眉再奇数页 引用域 标题格式6.目录自定义生成 3-4级重复生成目录 再翻译成英文done...
2022-03-19 16:02:04
495
原创 外文参考文献找不到页码怎么办?
以下几个方法可以交替使用:一、复制文章标题到百度学术,点引用即可查看二、到谷粉学术进行同样操作也可得。这里说明下,操作不要太快,不然要让你登录账号,然而登录账号是要花钱才能获取引用信息的。三、上sci-hub网站输入文章的doi(这个可以从百度学术获取),获取原文查看页码...
2021-04-29 17:35:26
74564
5
原创 数据埋点
一、热力图热力图的应用网站、app不同区域通行汽车的热力图不同商圈人流的热力图不同区域的人口迁徙热力图不同旅行区域人口进出热力图不同区域PM2.5热力图上述这些热力图的数据来源可能是什么?二、数据思维1.通过数据发现潜藏的规律2.通过数据优化产品设计3.通过数据纠正认知、决策偏差二、数据获取技术–数据埋点1.如何描述一个点when where who how what2.页面埋点页面名称 页面ID 进入时间 退出时间 用户id3.事件埋点用户id 事件名称 事件id 触
2021-04-07 12:33:47
180
原创 欢迎使用CSDN-markdown编辑器--保留
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2021-02-19 13:26:26
68
原创 数据分析学习之书籍...未完...
工具的使用:mysql必知必会利用python进行数据分析统计知识的学习:贾俊平《统计学》图灵出版《面向数据科学的实用统计学》机器学习学习:李航 《统计学习方法》张良均 《Python数据分析与挖掘实战》第二版JiaweiHan(韩家炜)《数据挖掘概念与算法》 黑皮书数据运营之学习宋天龙《Python数据分析与数据化运营》 第2版在线网课:清华大学 慕课 数据挖掘:算法导论MOOC 南大 张莉 利用python玩转数据...
2021-02-18 19:09:26
73
原创 kaggle-House Prices - Advanced Regression Techniques回归模型预测房价--数据来源
机器学习回归预测 模型训练数据先占个坑数据来源:https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data
2021-01-15 20:15:06
161
原创 解决python在cmd窗口pip安装库、安装包失败
最近几天在cmd窗口安装 gensim库,老是collecting后就一直报错,连接超时,broken by 'ConnectTimeoutError,要么就说 Could not find a version that satisfies the requirement gensim (from versions: )No matching distribution found for gensim。今天问了大佬们,才知道有这么个妙招,就是用清华镜像。我今天安装的是 gensim库。原来用pip
2020-08-16 00:00:05
1233
原创 小白爬虫学习--Xpath定位信息--举一反三#
断断续续学了好多次爬虫,始终没抓到重点,最近两天终于摸到点门路,发现定位信息是最重要的,定位好了,再借助解析库就可以提取想要的信息了。基本套路如下:(爬虫三部曲)第一,抓取网页源代码url = “你爬取信息的网址”headers = 请求头...
2020-07-01 12:43:15
470
原创 小技巧##Windows10在当前目录快速打开cmd的方法
参考链接:Windows10在当前目录快速打开cmd的方法总结一下就是:在当前文件夹下,按住Shift键 和 鼠标右键,打开Powershell窗口。输入 start cmd 回车。即可。
2020-06-10 15:59:34
174
原创 matplotlib柱状图之子柱状图不同颜色—20种颜色列表
color=[‘grey’,‘gold’,‘darkviolet’,‘turquoise’,‘r’,‘g’,‘b’, ‘c’, ‘m’, ‘y’,‘k’,‘darkorange’,‘lightgreen’,‘plum’, ‘tan’,‘khaki’, ‘pink’, ‘skyblue’,‘lawngreen’,‘salmon’]
2020-06-07 21:20:22
19237
2
原创 matplotlib绘图怎么开始?此文必看
学了一段时间matplotlib,才发现自己连绘图原理都没搞懂,我说怎么上手起来怎么晦涩。直到今天看到了这篇文章。matplotlib绘图的核心原理讲解
2020-06-03 19:26:17
648
原创 文本预处理---批量去除停用词—小白代码详细解释
经过摸索,学习,仿照大佬们的代码,终于折腾出自己的结果。我要处理的文件是这样的:运行无bug的代码放上import jieba # 创建停用词list函数def stopwordslist(filepath): stopwords = [line.strip() for line in open(filepath, 'r', encoding='utf-8').readlines()] #分别读取停用词表里的每一个词,
2020-05-29 14:44:41
6869
8
原创 关于读取文件失败
太久没遇上这个问题了今天碰上刚好回顾一下文件路径以及python语法中涉及到的反斜杠 转义符问题,在python字符串中 \ 有转义的含义,如\t可代表TAB,\n代表换行,所以我们需要采取一些方式使得\不被解读为转义字符。目前有3个解决方案:参见:https://blog.csdn.net/xd060606/article/details/87164798...
2020-05-27 21:46:48
1961
转载 pandas中的groupby函数的分组结果怎么保存成DataFrame##转
困扰了我几天的问题终于得到解决原来是reset_index 函数参考见https://blog.csdn.net/juzexia/article/details/78728293
2020-05-27 14:56:42
2456
原创 ntllk 缺少 stopwords
以下操作 前提是 你已经安装好了nltk即你在python环境下输入 import nltk 不会报错then 你输入 from nltk import stopwords报错 说什么Import Error解决办法打开cmd 命令窗口输入下面3条语句pythonimport nltknltk download()/ltk.download(‘stopwords’)如图接着会弹出一个窗口,如下图,然后点进中,下滑找到 stopwords 点击 download,若显示绿色条,即成功
2020-05-26 16:02:14
296
原创 踩坑无解:spyder读取csv文件失败(今天是个意外~)
今天用spyder读取csv文件失败,文件就在运行环境当前目录下,读取语句是pd.read_csv('8.1wine1.csv')就是读取失败,放到jupyter就可以读取成功,或者是换成文件路径是“全路径“也可以读取成功。但是之前在Spyder上我也是这个语句读是成功的,今天不知怎么回事,看了一些资料说什么转码还是什么转义符的我真是看不懂,先记下吧,以后再说。...
2020-05-18 11:42:51
3686
原创 python中numpy实现符号矩阵&布尔索引
折腾我几天的符号矩阵,原来用numpy的where函数即可。将一个随机生成的矩阵数据,转换成符号矩阵,其实就是将其中的正值都替换成1,将所有的负值替换为-1,使用np.where即可实现import numpy as npx = np.random.randn(3,3)#x的符号矩阵yy = np.where(x>0,1,-1)笨一点的方法就是import numpy as ...
2020-04-29 10:00:40
1276
原创 基于随机森林的红葡萄酒分析
import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import GridSearchCVimport warningswarnings....
2020-04-28 11:23:35
2160
原创 markdownpad2 HTML渲染失败
markdownpad2HTML渲染失败已经第二次了,上次明明解决了的,肯定是我中途把什么重要的东西删掉了><。原来就是要安装一个插件,但是我之前明明下载安装过了><。Awesomium 1.6.6 SDK然后下载Awesomium 1.6.6 SDK,安装就对了,选择典型安装。ok....
2020-04-28 11:07:49
221
原创 使用whiten报错
import numpy as npfrom scipy.cluster.vq import vq,kmeans,whitendata = np.array([[list1],[list2],[list3],[list4],[list5],[list6]])whiten = whiten(data)报错ValueError: object arrays are not supporte...
2020-04-27 12:02:06
478
3
原创 DataWhale-task2:爬取中国大学排名&丁香论坛评论
任务2事实上这两个项目的实现代码我都没搞清楚,可能涉及到的BeautifulSoup和Xpath我都没搞明白吧,然后这次的网页中爬取内容的定位我也发现有些找不到,T_T。代码都不是我敲的哦,都是Datawhale分享的资料,特此说明啊~爬取中国大学排名'''爬取url:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html爬取思路:...
2020-04-23 19:33:40
290
原创 task1 - 爬取豆瓣Top250电影名
豆瓣Top250电影名怎么爬(⊙o⊙)…>< 爬虫小白,困难重重。 (今天是为了打卡而打卡><)参考博文:https://www.cnblogs.com/leon507/p/7614345.html怎么实现因为没有系统学习过,所以只能做搬运工。看了几篇有关爬取豆瓣Top250的电影信息,这篇是最简单易懂的了,所以摘过来学习学习。但这个博主的代码只是爬了电影名,然后也...
2020-04-21 18:48:52
1407
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人