自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 机器学习_特征工程和文本特征的提取

文章目录1.数据集的组成2.特征抽取3.文本特征抽取以及中文问题4. tf-df分析问题1.数据集的组成文件pandas/numpykaggleUCIscikit-learn常用数据集结构特征值+目标值特征值:身高,体重,肤色,头发长目标值:男,女pandas:读取数据 dataframe 缺失值,数据转换重复值,需要进行去重sklearn:对特征进行 处理特征工程:将原始数据转换为更好预测模型的特征值#安装scikit-learnpip3 install Scikit-

2021-07-15 17:37:35 240

原创 矩阵和线性代数

文章目录

2021-03-13 18:43:58 81

原创 概率论与贝叶斯检验

文章目录1.本福特定律2 商品推荐3 概率1.本福特定律实际生活中得到的一组数据中,以1为首位数字出现的概率约为总数的三成,是直观想象的1/9的三倍2 商品推荐A 0.8 B 0.2 A取0-0.8 B取0-0.2 B比A得分高的概率3 概率...

2021-03-13 17:33:11 535

原创 机器学习理论基础

文章目录

2021-03-08 21:18:32 80

原创 pandas实例

文章目录1 统计不同月份不同类型电话次数1 统计不同月份不同类型电话次数import pandas as pdfrom matplotlib import pyplot as pltdf = pd.read_csv("./911.csv")

2021-03-04 15:17:46 188

原创 pandas_数据的合并和分组聚合

文章目录1.字符串离散化(统计电影分类)2.数据合并3.数据的分组聚合4.数据的索引5.通过索引取值1.字符串离散化(统计电影分类)import pandas as pdimport numpy as npfile_pat = "./IMDB-Movie-Data.csv"df = pd.read_csv(file_path)#统计分类的列表temp_list=df["Genre"].str.split(",").tolist()genre_list = list(set([i for

2021-02-25 22:18:05 200 1

原创 pandas

pandas文章目录pandas01 pandas之Series的索引和值02 pandas 读取外部数据03 pandas Dataframe01 pandas之Series的索引和值pandas可以处理非数值类型的数据series 带标签的数组import pandas as pdpd.Series([1,2,31,12,3,4]) #Series 带标签的数组#out0 11 22 313 124 35 4dtype: int64

2021-01-13 21:21:35 65

原创 numpy的常用方法

文章目录01 创建数组02 数组的计算03 读取本地数据和索引04 numpy中的索引和切片01 创建数组import numpy as np#创建数组t1 = np.array([1,2,3,])print(t1)print(type(t1))t2 = np.array(range(10))print(type(t2))print(t2)t3 = np.arange(4,10,2)print(type(t3))print(t3)print(t3.dtype)#创建指定类

2020-12-16 10:11:57 163

原创 绘制散点图

文章目录01绘制散点图01绘制散点图from matplotlib import pyplot as pltfrom matplotlib import font_managery_3 = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]y_10 = [26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15

2020-12-10 09:54:35 273

原创 数据分析的介绍_matplotlib

文章目录01 数据分析的介绍01 数据分析的介绍matplotlib : 画图numpy: 数值pandas: 字符串、列表、字典

2020-12-07 22:25:36 58

原创 模块_上传和发布

文章目录1.模块和包2.模块的导入3.包的使用4.sys.path()和模块搜索路径5 模块的发布和安装6 上传模块到PyPi1.模块和包量变引起质变,物以类聚,把功能相似的模块打包成一个包python——包——模块——函数——语句便于后期反复使用、反复搭建模块化编程的流程实际API,进行功能描述编码实现功能模块中编写测试代码,消除全局代码使用私有函数API 应用程序编程接口模块名对应源文件名,但仅仅有一个例外,当一个模块作为程序入口时,他的’name’的值为’main’可以根据这

2020-12-04 21:26:21 155

原创 文件操作(IO技术)_递归

文章目录文件操作(IO技术)1 读取和关闭2 中文乱码问题3 close()4 with(上下文管理器)5 文本文件的读取6 enumerate()文件操作(IO技术)1 读取和关闭文本文件:存储字符的文件 python默认使用unicode(两个字节一个符号,最多可以表示65536)二进制文件:用“字节”进行存储创建文件对象open()f = open(r’d\b.txt’,‘a’)r 读模式w 写入,如果文件存在,重写内容(处理字符)a 追加模式,文件不存在创建,文件存在末尾追加

2020-12-03 21:30:31 117

原创 异常_pycharm开发环境调试

1 异常异常:程序中出现的非正常现象异常处理:程序出现问题时依然可以正确的执行剩余程序异常采用对象的方式来处理1.抛出异常2.捕获异常1.1 try… 一个except结构try: 被监控的可能引发异常的语句块except BaseException[as e]: 异常处理语句块print('step0')try: print('step1') a = 3/0 print('step2')except BaseException as e: pr

2020-11-28 12:47:01 208

原创 方法_面向对象三大特征_设计模式

文章目录1 方法没有重载2 方法的动态性3 私有属性和私有方法(封装)4 @property装饰器5 面向对象三大特征5.1 继承5.2 方法重写1 方法没有重载python中,方法的参数没有确定类型(调用时确定参数的类型)在类中定义多个重名方法,只有最后一个方法有效2 方法的动态性可以给类添加对象方法和函数都是对象class Person: def work(self): print("努力上班!

2020-11-27 15:17:48 189

原创 嵌套函数_nonlocal_LEGB_面向对象的编程

文章目录1.嵌套函数(内部函数)2.nonlocal_global3.LEGB规则4.面向对象编程4.1类的定义4.2构造函数1.嵌套函数(内部函数)在函数内部定义函数外部无法调用内部的函数降低重复代码def outer(): print("outer runing") def inner01(): print("inner01 running") inner01()outer()def printName(isChinese,name,fami

2020-11-25 09:44:54 110

原创 函数_全局变量和局部变量_参数传递_拷贝_lambda_eval_递归

文章目录函数也是对象全局变量和局部变量局部变量和全局变量效率分析函数也是对象def test01(): print("sxtsxt")test01()c = test01c()print(id(test01))print(id(c))print(type(c))#运行结果sxtsxtsxtsxt16079121188801607912118880<class 'function'>全局变量和局部变量全局变量:作用域为定义的模块降低了函数的通用性和可

2020-11-23 19:46:00 381

原创 循环_推导式_绘制棋盘_函数

文章目录for循环range对象嵌套循环break 和continueelse语句循环代码的优化zip并行迭代推导式绘制棋盘函数用法和底层分析形参和实参函数的注释返回值for循环#元组for x in (10,20,30): print(x*30)#字符串for y in 'abcdef': print(y)#字典d = {'name':'wy','age':18,'job':'stu'}for z in d: print(z)for z in d.keys():

2020-11-21 00:35:46 540

原创 20201119-python基础知识-day4

字典键值对的无序序列,成对存储,通过键操作值键:整数、浮点数、字符串、元组值:任意可重复创建字典#(1)通过{},dict创建>>> a = {"name":"wy","age":20,"ij":[2,3,5]} #{}创建用:,而且键要用字符串>>> a{'name': 'wy', 'age': 20, 'ij': [2, 3, 5]}>>> b = dict(name="wy",age=20,ij=[2,3,5]) #用dict创建

2020-11-19 11:44:39 100

原创 20201118_python基础知识_day3

可变字符串遇到可变字符串修改的比较频繁的时候,考虑使用IO模块>>> a = 'hello,sxt'>>> import io>>> sio = io.StringIO(a)>>> sio<_io.StringIO object at 0x00000252491B8280>>>> sio.getvalue()'hello,sxt'>>> sio.seek(7)7&gt

2020-11-18 20:42:04 76

原创 20201118-python基础知识-day2

3个基本概念链式赋值把同一个对象赋值给多个变量x=y=1系列解包赋值a,b,c=1,2,3a,b=b,a #变量互换常量python不支持常量(大写,下划线隔开)基本内置数据类型type整型浮点型布尔型字符串型divmod可以同时得到商和余数0B 二进制 010O 八进制 0-70X 十六进制 0-9 abcdef整数int()实现类型转换int(3.14)3int(TRUE)1int(FALSE)0整数和浮点数运算的结果是浮点数int可以存储

2020-11-18 13:16:35 132

原创 20201117_python基础知识_day1

python介绍解释型、面向对象简洁简单是由C语言开发的面向对象免费和开源可移植和跨平台(java)丰富的库可扩展性(C C++)应用范围科学计算人工智能WEB服务端和网站后端(YouTube)GUI开发游戏移动设备嵌入系统大数据云计算不用python的时候python性能较低目前用python3python解释器CpythonJythonIronPythonPypypython安装和配置注意增加到环境变量开发环境IDE解释器的外

2020-11-17 20:15:27 189 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除