大数据——数据挖掘
文章平均质量分 75
python、数据分析、机器学习、深度学习、优化算法
友培
感觉数据+AI之美
展开
-
强化学习(RL)入门
强化学习入门原创 2023-04-02 20:28:23 · 1949 阅读 · 1 评论 -
Pytorch入门
pytorch入门记录原创 2022-10-09 21:33:03 · 2045 阅读 · 0 评论 -
Tensorflow2.0入门
tensorflow2.0入门原创 2022-07-31 17:55:38 · 621 阅读 · 0 评论 -
最优化——GA遗传算法+PSO粒子群算法
最优化算法原创 2022-07-28 21:02:29 · 3424 阅读 · 0 评论 -
时间序列——python3手撕指数平滑代码
文章目录数据介绍python一二次平滑指数法数据介绍传送门一段值是value,一段值是时间index_array处理后数据为下图,可以理解为联合index,具有唯一性value_array处理后数据为下图,可以理解为,每一个小列表对应上图的一个index,31天数据,一共24个indexpython一二次平滑指数法误差采用的是均方误差# -*- coding: utf-8 -*-# @Time : 2022-04-07 15:44# @Author : XiaoYouPei# @原创 2022-04-07 22:01:55 · 1250 阅读 · 0 评论 -
python机器学习基础05——sklearn之逻辑回归+分类评价指标
文章目录逻辑回归逻辑回归的损失函数逻辑回归API分类模型的评价指标混淆矩阵准确率召回率(较多被使用)精确率f1-score:精确率和召回率的调和平均数AUC逻辑回归逻辑回归是经典的分类模型,使用的是sigmod函数函数解释:Sigmoid函数是一个S型的函数,当自变量z趋近正无穷时,因变量g(z)趋近于1,而当z趋近负无穷时,g(z)趋近于0,它能够将任何实数(非0和1的标签数据)映射到(0,1)区间,使其可用于将任意值函数转换为更适合二分类的函数。 因为这个性质,Sigmoid函数也被当作是原创 2022-02-16 21:05:01 · 5010 阅读 · 0 评论 -
python机器学习基础04——sklearn之朴素贝叶斯
文章目录朴素贝叶斯算法高斯模型多项式模型朴素贝叶斯算法相关重点处:https://blog.csdn.net/xiaoyoupei/article/details/122641753贝叶斯思想,其实就是计算出条件概率(也就是某条件情况下,导致的结果的概率,选择概率大的)贝叶斯定理中必要知道什么是先验概率和后验概率。什么是先验概率和后验概率?举个例子:假设我们出门堵车的可能因素有两个:车辆太多和交通事故。先验概率:堵车的概率就是先验概率(不管有没有其他事件的发生造成的堵车)后原创 2022-02-15 21:34:43 · 2527 阅读 · 0 评论 -
python机器学习基础03——sklearn之线性回归相关处理
文章目录线性回归+评价指标引入误差L范式介绍sklearn-线性回归评价指标多项式回归和过拟合欠拟合处理欠拟合的处理-多项式回归过拟合处理-正则化线性回归+评价指标引入误差在回归任务中不需要归一化的操作,本身就是寻找出权重的过程,不需要将各维度进行统一约束找出特征和特征权重之间的一种组合,从而来预测对应的结果,误差的存在是必然的,回归的问题不像分类的问题,回归是一个连续值的预测,分类而是离散值的确定,那我们如何处理回归的误差?回归算法是一个迭代算法。所谓的迭代就好比是系统版本的迭代,迭代后的系原创 2022-02-12 19:28:54 · 2787 阅读 · 0 评论 -
python机器学习基础02——sklearn之KNN
文章目录KNN分类模型K折交叉验证KNN分类模型概念:简单地说,K-近邻算法采用测量不同特征值之间的距离方法进行分类(k-Nearest Neighbor,KNN)这里的距离用的是欧几里得距离,也就是欧式距离import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifier原创 2022-02-11 21:22:46 · 3270 阅读 · 0 评论 -
python机器学习基础01——sklearn开启
文章目录机器学习开发流程特征工程字符串特征化one hot编码文本特征化jieba分词数值型数据预处理归一化标准化特征选择Filter过滤式(方差过滤)PCA降维数据集数据集划分数据集接口介绍机器学习开发流程1.数据采集公司内部产生的数据和其他公司合作获取的数据购买的数据2.分析数据所对应要解决需求或者问题是什么?根据目标数据推断问题属于回归还是分类!3.数据的基本处理数据清洗合并级联等4.特征工程:对特征进行处理特征抽取特征预处理降维等5.选择合适的模型,原创 2022-02-08 19:49:22 · 1566 阅读 · 0 评论 -
python数据分析基础04——种草画图pyecharts
文章目录pyecharts传统的自然还是matplotlib绘图为主要,推荐下pyecharts贴上地址:https://echarts.apache.org/zh/index.htmlpyechartspyecharts 是一个用于生成 Echarts 图表的Python库。Echarts是百度开源的一个数据可视化 JS 库,可以生成一些非常酷炫的图表。环境安装pip install pyechartsPyecharts在1.x版本之后迎来重大更新,与老版本(0.5X)已是两原创 2022-02-07 19:47:43 · 689 阅读 · 0 评论 -
python数据分析基础03——练习项目
文章目录人口分析案例2012美国大选献金项目数据分析需求人口分析案例需求:导入文件,查看原始数据将人口数据和各州简称数据进行数据汇总将汇总的数据中重复的abbreviation列进行删除在汇总的数据中查看存在缺失数据的列在汇总的数据中找到有哪些state/region使得state的值为NaN,进行去重操作为找到的这些state/region的state项补上正确的值,从而去除掉state这一列的所有NaN汇总的数据和各州面积数据areas进行汇总我们会发现area(sq.mi)这一原创 2022-02-07 19:33:00 · 522 阅读 · 0 评论 -
python数据分析基础02——pandas相关操作
文章目录pandas高级操作替换操作映射操作运算工具排序实现的随机抽样数据的分类处理高级数据聚合数据加载透视表交叉表pandas高级操作import pandas as pdimport numpy as npfrom pandas import DataFrame替换操作替换操作可以同步作用于Series和DataFrame中单值替换普通替换: 替换所有符合要求的元素:to_replace=15,value=‘e’按列指定单值替换: to_replace={列标签:替换值}原创 2022-02-07 19:30:38 · 811 阅读 · 0 评论 -
python数据分析基础01——numpy基础、pandas数据清洗
文章目录Numpy常用属性索引和切片变形级联图片操作统计函数矩阵PandasSeriesDataFrame股票分析案例数据清洗空值数据重复数据异常数据Numpypython语言中做数据科学的基础库,注重数值的计算,大多数python科学计算库的基础# 数组和列表的区别# 数组中只可以存储相同类型的元素# 数组中出现不同类型的元素,会根据类型优先级进行数据转换# 数据优先级# 字符串>浮点型>整型# 创建数组的方式# 1、np.array()# 2、plt创建# 3、原创 2022-01-17 21:19:39 · 1417 阅读 · 0 评论 -
python入门基础05——迭代器、生成器、装饰器、二叉树
文章目录迭代器自定义迭代器推导式生成器装饰器二叉树迭代器迭代器是一种可以被遍历的对象,并且可作用在next()函数可被迭代的对象不一定是迭代器,如列表、字符串# 创建迭代器,字符串、列表和元组对象、自定义对象都可创建迭代器# 使用python内置iter()方法创建alist = [1, 2, 3, 4, 5]it = iter(alist)print(type(it))for i in it: print(i)# 迭代器作用???优点:节省内存,在内存中只占一个数据的空原创 2022-01-14 20:49:32 · 351 阅读 · 0 评论 -
python入门基础04——面向对象、链表、异常处理
文章目录面向对象类实例变量和类变量self类的方法对象关联关系封装、继承、多态type和isinstancenew方法和self成员保护和访问限制反射单例模式链表异常处理面向对象面向过程的程序设计核心就是过程(流水线思维),优点就是顺着执行步骤开发,缺点就是牵一发而动全身面向对象OOP,是一种程序思想,把对象作为程序基本单元,一个对象包含数据和操作数据的方法类用来描述相同属性和方法的对象的集合class 类名():# 类名首字母一般大写 pass实例变量和类变量定义在_原创 2022-01-13 21:34:55 · 436 阅读 · 0 评论 -
python入门基础03——函数、文件、模块/包
文章目录函数基本参数传递参数类变量的作用域代表函数Rang匿名函数递归函数文件操作模块和包模块/包常见模块函数# 一般格式def my_function(): 代码块 return xxx # 不写,默认为return None 代码块 # 注意,在return后面的语句不会执行 # 函数只有调用了才会执行def function1(): print('执行function1') def function2(): # 内部函数原创 2022-01-12 21:27:01 · 202 阅读 · 0 评论 -
python入门基础02——流程控制
文章目录流程控制举例子:猜数字排序算法冒泡排序选择排序插入排序二分查找时间复杂度流程控制# 条件判断 if # 单分支if 表达式: 代码块# 多分支age = input('输入年龄')age = int(age)if age>=18: print("成年")elif age>=12: print("少年")elif age<12: print("儿童")# 猜数字游戏num = 9guessNum = input('please原创 2022-01-09 21:10:15 · 287 阅读 · 0 评论 -
python入门基础01——数据类型
python3.x基础数据类型anaconda3搭建自寻anaconda3启动jupyterjupyter notebook --ip=0.0.0.0 --port=8080 --allow-root --no-browser输入输出# 输出传参name = 'xiao'age =22print("我的名字为%s,年龄为%d"%(name,age))# 键盘输入# input返回时字符串name = input('enter your name:')print("我的名字是原创 2022-01-08 21:30:37 · 724 阅读 · 0 评论