自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呆萌的代Ma

战力只有5的渣渣,发奋图强中

  • 博客(9)
  • 资源 (13)
  • 收藏
  • 关注

原创 vscode 配置 Latex 编译后自动清理多余文件(.log .out等文件)

在使用vscode配置Latex时我们都会安装一个环境,就是:Latex Wordshop,在setting中是可以设置生成pdf后清理这些文件,但是版本不同的设置的方法也不同,因此:新版:setting中配置: "latex-workshop.latex.autoClean.run": "onBuilt", //注意结尾是 t 不是 d "latex-workshop.lat...

2019-05-27 09:10:56 11734 10

原创 Python 简写操作(for、if简写、匿名函数)

使用jupyter之后感觉每行代码都有种寸土寸金的感觉,所以今天总结一下常用的简写代码的方法:目录1 for 简写1.1一层for循环简写:1.2两层for循环2 if简写2.1for与if 的结合怎么简写3匿名函数lambda1 for 简写先举一个例子:y = [1,2,3,4,5,6][(i*2) for i in y ]会输出...

2019-05-15 14:46:36 59612 7

原创 机器学习训练建模、集成模型、模型评估等代码总结(2019.05.21更新)

这篇博客总结一些有关机器学习的模型代码与评价指标,力求一针见血,复制粘贴即可食用,hhhhhh,不定期更新代码中使用的案例是pandas构造的dataframe型的数据,变量名为dataframe,最终的模型结果交result_model,它差不多长这么样子,也就是通过前面的这么多项特征预测 mask,当然,mask不一定都是0/1,只是以此为例: tbi_value ...

2019-05-14 17:12:39 7111 4

原创 Scrapy周期性爬取(解决Unknown command: crawl报错)

Scrapy框架(1.2.0)并没有直接周期性爬取的命令,而且如果配置不当,会导致Unknown command: crawl的报错,配置周期执行并不简单,因此这篇博客解决这个问题,一劳永逸。思路是:调用linux的定时任务定时执行一个启动框架的python文件目录:1使用python程序启动scrapy2使用Linux脚本启动python并配置定时任务1使用pyt...

2019-05-14 13:50:25 1468

原创 python读取一个目录下的文件名(不会递归往下读)

每次需要读目录的时候就要到网上找,经常忘记,这次写一个博客记录一下。import osdef readfile(path): files = os.listdir(path) file_list = [] for file in files: # 遍历文件夹 if not os.path.isdir(file): fi...

2019-05-13 17:49:37 1626

原创 pandas忽略行列索引,纵向拼接多个dataframe

从wind上面搞到一批股票数据后发现:本来是一个类型的数据,但是由于季度不同,列名也不同,导致使用pandas合并多个报表的时候总是出现一大堆NaN,所以这里我写了一个函数,专门针对这样的表它的思路是:生成一堆单词,然后把这些表的列索引全部替换为这些单词,然后调用 pd.concat()把这些dataframe全部合并后再把列索引改回来,当然,这里也可以手动指定列索引。使用方法见代...

2019-05-13 17:45:20 10116 1

原创 Matplotlib 整合与细节操作(样式、图例、风格、轴线、网格)

目录1图形样式1.1 jupyter显示图像1.2 线条样式1.3 图像样式1.3.1 图形标注1.3.2 图像填充1.3.3 子图1.3.4 坐标轴样式1.4 全局风格2定制图像2.1 坐标轴2.1.1隐藏 x/y 坐标轴2.1.2隐藏坐标刻度2.1.3隐藏坐标轴线2.2图像2.2.1增加网格2.2.2增加...

2019-05-11 10:56:54 2389

转载 Windows修改jupyter默认工作路径

转载自:https://blog.csdn.net/white_rabbit_2/article/details/83862429按照网上流传的三种修改方式一步一步做下来,都没有成功。反复试验了几次终于成功了。后来推测大概是安装过程和系统环境不同导致的。我的环境:我用的系统是 Win 10,Anaconda 是从官网直接下载 .exe 文件安装的。所有设置都是默认设置。 Jupyter ...

2019-05-10 09:34:22 12017 8

原创 pandas日常数据处理

这篇博客总结一些pandas的常用处理方法,直接结合例子,使用时直接复制代码即可,希望能够帮助到大家。这里面series表示Series类型对象,dataframe表示Dataframe类型对象,使用替换变量名即可。目录1 行/列/单元格 选择1.1 通过索引选择1.2 通过位置选择1.3得到指定区域/单元格2 循环处理数据2.1 直接循环行2.2 循环...

2019-05-06 15:47:22 1546

使用pyLDAvis的实例结果,及d3.min.js,ldavis.v1.0.0.css,ldavis.v1.0.0.js

1. d3.min.js,ldavis.v1.0.0.css,ldavis.v1.0.0.js三个文件内容 2. pyLDAvis的实例 3. 实例请参考:https://blog.csdn.net/weixin_35757704/article/details/123150467

2022-02-26

geth_tools.tar.gz

以太坊go-ethereum v1.9.22的官方代码编译后,bin目录下的工具包,可以直接使用

2020-12-27

handless_firefox.tar

包含已调试好的selenium、firefox与python3.6的docker镜像文件,同时有一个测试案例,可以直接运行,使用无界面firefox访问网站

2020-12-26

呆萌的停用词表.txt

停用词表,一共2750个停用词,属于通用停用词表。 下载了很多网上的通用停用词表,同时合并了我们实验室的停用词表后使用下面的代码对停用词表整理。

2019-06-14

主流售房网站爬虫

通过jsoup对主流售房网站的房屋信息进行爬取与提取,然后通过poi将数据保存在本地的excel数据表中。

2017-12-13

一键安装libpcap及其所有依赖文件的脚本

这是一个快速安装libpcap的shell脚本 运行 sudo add_libpcap.sh 在运行中会在桌面上暂时的新建一个libpcap_dir的文件夹,用来暂时存放所有的文件,在安装完成后会删除这个文件夹。 安装文件的版本: m4-1.4.9 bison-3.0 flex-2.6.0 libpcap-1.8.1

2017-11-26

网页爬取爬虫

使用java语言快捷的爬取整个网页的源代码,并且将爬取成功的网页代码与出现错误的网址的错误信息保存到本地文件中.

2017-10-10

Linux离线中文命令手册

linux命令手册,能够快速的查看命令与用法

2017-07-20

软件开发常用词汇

软件开发的常用英文单词及对应中文翻译

2017-07-20

Git 64位 最新版 Git-2.13.1.2-64-bit

Git 64位 最新版 Git-2.13.1.2-64-bit,从官网直接下载

2017-06-20

Python2.x链接Mysql的安装文件

Python2.x直接链接mysql的安装文件

2017-04-23

Python3链接Mysql的64bit安装文件

Python3链接mysql的文件

2017-04-23

W3Cschool参考手册资料

2017-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除