python
一个想当作家的程序员
大数据开发工程师
博客主要方向
基础数据分析-基础算法-数据挖掘-人工智能相关算法-部分大数据基础与技术
展开
-
python-日期操作
python日期操作原创 2023-02-17 19:05:59 · 180 阅读 · 0 评论 -
python 打包成第三方工具时 加载包里文件
get_module_res = lambda *res: os.path.normpath(os.path.join(os.getcwd(), os.path.dirname(__file__), *res))最近需要将python代码放在集群上,在加载如dict.txt的本地文件时存在问题想要文件和python文件一起打包主要在集群上运行时不能够识别到包里的路径通过以上的代码可以成功识别到,灵感来自于jieba分词第三方包中对于词典文件的加载...原创 2022-02-14 16:11:01 · 315 阅读 · 0 评论 -
python-TypeError: list indices must be integers, not tuple Solution
问题来源:自定义list[ [list] [list] ]报错原因:list 数组中数组之间少个逗号改成:list[ [list] ,[list] ]https://careerkarma.com/blog/python-typeerror-list-indices-must-be-integers-not-tuple/原创 2021-04-29 15:14:17 · 286 阅读 · 0 评论 -
数据挖掘与机器学习————降维之主成分分析法(PCA,Principal components analysis )
1.概述PCA(Principal components analysis)是一种降维方法、一种线性变换。这个变换主要是利用正交变换(基变换),将数据变换到一个新的坐标系中,使得原本难以分割的数据变得好分割,即线性无关。2.数学基础内积(又名点积、数量积、标量积)、方差、协方差、实对称矩阵、对角化、正交矩阵、正交变换、特征值以及特征向量的求法。内积:...原创 2020-09-21 10:00:05 · 777 阅读 · 0 评论 -
Python-改进SEIR模型
原先写了篇论文,现在把代码分享给大家。代码import scipy.integrate as spiimport numpy as npimport matplotlib.pyplot as pltimport mathimport xlrd# I_0为感染者的初始人数 524*1.5I_0 = 198# E_0为潜伏者的初始人数E_0 = 630# R_0为治愈者的初始人数R_0 = 2# S_0为易感者的初始人数# S_0 = N - I_0 - E_0原创 2020-08-18 08:50:20 · 4710 阅读 · 8 评论 -
Python数据预处理----仿Label原理 字符类型数据映射成数值数据
看来题主还太年轻,不知道Python已有的库中有对于字符串类型数据的转换,因此手动写了一个。但是还是要提前说一下,相关方法都有哪些,后来以便做一次总结。对于某些数据属性是字符串代表的类型,在分类、聚类、回归时,为了方便处理,会将其对应转化成数值型。相关转换方法有: label encoding/one-hot encoding /target encoding等自定义仿label代码如下:import pandas as pd#将所获得的字典存入txt文件中def...原创 2020-08-05 22:40:32 · 1266 阅读 · 0 评论 -
Python--TypeError: ‘<‘ not supported between instances of ‘str‘ and ‘float‘
Label encodeing遇到的错误错误图示:代码没有错误,主要是数据处理错误。将字符类型利用label encoding映射成数字,但是数据原本有缺失。题主将其全部替换成了0,但是不能够同时处理字符串和数值的类型。因此将原本的0,全部又替换成了字符“a”,得到了解决。...原创 2020-08-05 22:32:16 · 7858 阅读 · 4 评论 -
Python快速基础--空值 无穷值处理
https://blog.csdn.net/yi976263092/article/details/87878112问题:在训练模型 fit(x_train,y_train) 时遇到报错ValueError:Input contains NaN, infinity or a value too large for dtype('float64')解决方法:1、检查数据中是否有缺失值,并做缺失值处理# 读取数据train = pd.read_csv('./data/tra...转载 2020-07-23 18:28:08 · 2944 阅读 · 0 评论 -
Python快速基础2-求解线性方程与非线性方程
最近有别个专业的同学来找我帮助求解一个方程组,基本求解方程公式如下:基本数据如下:t CI-CO 1 -171603.51 2 -171603.51 3 161584.14 4 209162.75 5 232952.05 6 232952.05 7 232952.05 8 242127.29 9 242127.29 10 242127.29 11 242127....原创 2020-07-18 12:10:25 · 597 阅读 · 0 评论 -
数据挖掘与机器学习——离群点检测之孤立森林(isolate forest)
1.简单解释利用二叉树和随机值,将数据分在左右。正常的自是子孙满堂,异常的显然孤家寡人。2.概念基础二叉搜索树、森林、随机森林、调和级数二叉搜索树(二叉查找树/二叉排序树 ,Binary Search Tree,BST)根节点的值大于其左子树中任意一个节点的值,小于其右节点中任意一节点的值。调和级数举例:3.理论定义下面的英文翻译综合了已有的关于孤立森林的中文解释和对英文原本的基本翻译,而不是对于英文的直接汉化。在完成基本英文翻译过程中,对于句子...原创 2020-07-14 01:58:42 · 2602 阅读 · 6 评论 -
python 快速基础-导入Excel表数据
#没有pandas包 需pip install pandasimport pandas as pd#文件路径file="F:\我的编程\数据挖掘\上课\大作业\data.xlsx"data = pd.read_excel(file) #读取数据#读取列属性为“f5”的数据data_f5=data['f5']原创 2020-06-04 18:43:48 · 660 阅读 · 0 评论