glory8901-CSDN博客

原创 miniconda的使用以及在指定位置创建conda的虚拟环境

Miniconda简介Miniconda是一款小巧的python环境管理工具，安装包大约只有70M多点，其安装程序中包含conda软件包管理器和Python。一旦安装了Miniconda，就可以使用conda命令安装任何其他软件工具包并创建环境等。本文是在Windows 10系统下进行下载和安装。

2023-07-26 10:22:00 6429

转载 python timestamp、time、datetime类型之间的互转

谈谈python time datetime timestamp之间转换_timestamp 转换_yrx0619的博客-CSDN博客

2023-04-14 10:08:43 176

原创 Markdown发布静态网页

对于展示型网站，例如官网这种场景，会有很多小的页面，运营会根据市场时刻有增删修改类似页面的需求，如果每次都响应运营的需求，不断地迭代增删页面，这个工作是很难终结的，运营不能及时看到页面，而开发会深陷在重复繁杂的工作中。市面上供用户使用，能生成 html 的编辑器多为富文本编辑器，富文本编辑器优点是样式可以自由定制，但在我们的官网场景中，样式的不可控反而成了其缺点，我们不可能让官网的展示凭用户喜好随意改动。把页面的控制权交给运营，解放其他人员，是这个方案最大的出发点。还有其他可以考虑，比如。

2023-04-10 10:25:11 865

转载统信UOS/Debian/Ubuntu完全卸载删除Docker

可能仍然存在一些docker文件。这个时候，你可以执行一下删除方式，再次进行卸载。卸载Docker，同时删除Docker镜像、容器、数据卷等文件。查看删除docker其他有没有没有卸载干净的包。删除docker的相关配置&目录。删除安装时自动安装的所有包。确定docker卸载完毕。确定docker卸载完毕。删除所有相关文件即可。

2023-04-06 14:11:50 2264

原创 Xpath、css选择器学习

xpath路径表达式笔记 - 阮一峰的网络日志 (ruanyifeng.com) CSS选择器笔记 - 阮一峰的网络日志 (ruanyifeng.com) 学爬虫利器XPath,看这一篇就够了 - 知乎 (zhihu.com)

2023-03-27 15:31:47 70

转载 Jupyter Lab | 安装、配置、插件推荐、多用户使用教程

Jupyter Lab是Jupyter的下一代笔记本界面，可让用户创建和共享包含实时代码、公式、可视化和叙述文本的文档。用途包括：数据清理和转换、数值模拟、统计建模、数据可视化、机器学习等等。

2023-02-23 12:57:08 3588

原创 mysql 8.0 忘记root密码-linux

mysql8重置root密码

2023-02-18 09:54:00 539

原创批量kill进程

批量清理进程

2022-11-27 23:03:00 273

原创拒绝ssh远程暴力破解-以centos7及centos8为例

centos中ssh的暴力破解防范方法

2022-11-27 18:53:28 1310

原创 linux搭建git服务器，windows客户端配置git

git服务端和客户端设置

2022-11-25 08:46:15 1062

转载 8个常用的数据清洗的Python代码

大数据工程师Kin Lim Lee在Medium上发表了一篇文章，介绍了8个常用的数据清洗的Python代码。这些用于数据清洗的代码有两个优点：一是由函数编写而成，不用改参数就可以直接使用。二是非常简单，加上注释最长的也不过11行。在介绍每一段代码时，Lee都给出了用途，也在代码中也给出注释。你可以把这篇文章收藏起来，当做工具箱使用。涵盖8大场景的数据清洗代码这些数据清洗代码，一共涵盖8个场景，分别是：删除多列、更改数据类型、将分类变量转换为数字变量、检查缺失数据、删除列中的字符串、

2022-05-22 23:05:45 1505

转载项目内导入相关py文件时：ModuleNotFoundError: No module named 错误的解决办法

1、如果需要导入的包和导入包的文件在同一个目录下，直接import即可例如b.py需要用a.py的某些代码就可以直接import2.如果导入的模块是在主程序所在目录的子目录下可以在子目录中增加一个空白的__init__.py文件，该文件使得python解释器将子目录整个也当成一个模块，然后直接通过“import 子目录.模块”导入即可。例如b.py需要用c.py的某些代码就可以直接import3.如果导入的模块是在主程序所在目录的父目录下，则要通过修改path来解决，有两种方法：...

2022-02-09 15:05:21 9721

原创 python一些优秀第三方包

Tablib 模块简介:在Python 程序中，可以使用第三方模块Tablib 将数据导出为各种不同格式，包括Excel、JSON、HTML、Yaml、CSV和TSV 等格式。金融分析talibtalib 是Python金融量化的高级库，涵盖了150多种股票、期货交易软件中常用的技术分析指标，如MACD、RSI、KDJ、动量指标、布林带等等。pandas...

2022-01-09 11:16:38 478

转载 Python机器学习之文本分类——朴素贝叶斯分类器

参考1：Python机器学习(5)——朴素贝叶斯分类器 - 钱银 - 博客园朴素贝叶斯分类器是一个以贝叶斯定理为基础，广泛应用于情感分类领域的优美分类器。本文我们尝试使用该分类器来解决上一篇文章中影评态度分类。1、贝叶斯定理假设对于某个数据集，随机变量C表示样本为C类的概率，F1表示测试样本某特征出现的概率，套用基本贝叶斯公式，则如下所示：上式表示对于某个样本，特征F1出现时，该样本被分为C类的条件概率。那么如何用上式来对测试样本分类呢？举例来说，有个测试样本，其特征F1出现了.

2021-11-29 17:39:03 2338

转载 mysql insert ignore与replace into区别

mysql中常用的三种插入数据的语句:一、insert intoinsert into表示插入数据，数据库会检查主键（PrimaryKey），如果出现重复会报错；二、replace intoreplace into表示插入替换数据，需要定义PrimaryKey或者unique索引，如果数据库已经存在数据，则用新数据替换，如果没有数据效果则和insert into一样；REPLACE语句会返回一个数，来指示受影响的行的数目。该数是被删除和被插入的行数的和。如果对于一个单行REPLACE该数为

2021-11-03 12:16:32 168

原创 gensim使用

1. gensim 读取tencent ai参考文档：gensimmodels.keyedvectors – Store and query word vectors>>> from gensim.test.utils import common_texts>>> from gensim.models import Word2Vec>>>>>> model = Word2Vec(common_texts, size=..

2021-10-25 15:29:29 172

原创中文查重原理及算法实例（python）

1. simhash的算法原理https://github.com/1e0ng/simhashhttps://github.com/1e0ng/simhashsimhash的中文实现(python) - 简书最近工作上需要处理文本相似度的问题，一共5万多个文档；第一步，是先是要进行颗粒度较粗的，发现基本相似的文档，进行基本的 “聚类”；第二步，针对相似的文档，然后进行详细的比较；...https://www.jianshu.com/p/1187fb7c59c5GitHub - tianlian0/du.

2021-10-25 15:27:39 3777

原创 linux下定时器crontab的使用

项目开发中经常需要用将某个脚本定时运行从而避免其运行并不会影响到其他程序，下面是简略版。$ chmod 777 some_script.sh # 保证脚本是可执行的$ sudo crontab -e # -e参数表示进入编辑器添加所需的定时执行文件00 22 * * * some_script.sh # 前5个参数是数字：第1个表示分；第2个是小时；第3个是天（月份中的第几天）；第4个是月，第5个是天（星期中的第几天）。第6个参数是指定的文件======================.

2021-10-19 17:13:12 1667

转载 mybatis where trim标签

使用mybatis写where语句的时候，一般会这样写。<select id="findActiveBlogLike" resultType="Blog"> SELECT * FROM BLOG WHERE <if test="state != null"> state = #{state} </if> <if test="title != null"> AND title like #{title}

2021-10-16 14:02:59 635

原创 sklearn及gensim下lda模型的训练

sklearn【sklearn】利用sklearn训练LDA主题模型及调参详解_TiffanyRabbit的博客-CSDN博客sklearn不仅提供了机器学习基本的预处理、特征提取选择、分类聚类等模型接口，还提供了很多常用语言模型的接口，LDA主题模型就是其中之一。本文除了介绍LDA模型的基本参数、调用训练以外，还将提供两种LDA调参的可行策略，供大家参考讨论。考虑到篇幅，本文将略去LDA原理证明部分。https://blog.csdn.net/TiffanyRabbit/article/details

2021-10-08 17:51:51 2051

转载中文文本挖掘预处理流程总结

　　　　在对文本做数据分析时，我们一大半的时间都会花在文本预处理上，而中文和英文的预处理流程稍有不同，本文就对中文文本挖掘的预处理流程做一个总结。1. 中文文本挖掘预处理特点　　　　首先我们看看中文文本挖掘预处理和英文文本挖掘预处理相比的一些特殊点。　　　　首先，中文文本是没有像英文的单词空格那样隔开的，因此不能直接像英文一样可以直接用最简单的空格和标点符号完成分词。所以一般我们需要用分词算法来完成分词，在文本挖掘的分词原理中，我们已经讲到了中文的分词原理，这里就不多说。　　　　第二，中..

2021-10-08 16:37:33 1072

原创行情数据接口-美股版

一、美股历史数据API1.数据列表待完善补充2. 雅虎网（1）官网：https://www.yahoo.com/（2）安装 pandas-datareader命令行窗口：pip install pandas-datareader（建议）下载本地安装：https://pypi.org/project/pandas-datareader/（3）读取数据import pandas_datareader.data as pdr# 读取标普500sp500 = pdr.Data.

2021-08-28 07:55:43 3505

原创 pandas 两列的值转dict

1、把dataframe中的某两列变成一个key-value形式的dict 代码如下：import pandas as pddf = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': [2, 7, 1], 'C': [100, 87, 96]})# 形成以A为key,B为value的dictdc = df.set_index("A")["B"].to_dict()p...

2021-08-28 07:54:16 1846

原创中证指数公司调整指数样本股定期更换时间

　　摘自中国证券报　2013年7月2日上海证券交易所和中证指数有限公司日前宣布,自2013年下半年起调整指数样本股定期更换的时间,包括沪深300、上证180等主要指数的样本定期更换,提前至每年6月和12月的第二个周五收市后生效。　　相关人士表示,目前中证指数有限公司管理的沪深300、上证180等主要市场指数都是执行半年定期调整样本的规则,样本更换时间固定为每年6月和12月的最后交易日收市后生效,样本调整名单则一般提前两周公布。近年来指数化投资蓬勃发展,内地市场有150多只指数基金和ETF以中...

2021-08-26 18:22:05 1006

sbt 1.2.7 windows版本

Matlab 主题模型工具箱（Topic Modeling Toolbox 1.4）

空空如也