![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
哒哒等等
这个作者很懒,什么都没留下…
展开
-
数据预处理--标准化 特征降维 删除低方差特征和相关系数
def stand_demo(): data=pd.read_csv("dating.txt") data=data.iloc[:,:3] transfer=StandardScaler() data_new=transfer.fit_transform(data) print(data_new) return None[[0.44832535 0.39805139 0.56233353] [0.15873259 0.34195467 0.98724.原创 2021-12-05 22:16:54 · 395 阅读 · 0 评论 -
文本特征抽取
#设置停用词stop_words可以将某个feature_name去掉停用词表中的词会自动不出现在feature_names特征列表中(34条消息) 最全英文停用词表整理(891个)_以家为家,以乡为乡,以国为国,以天下为天下-CSDN博客_英文停用词表(34条消息) 中文停用词词表_BigDiaos的博客-CSDN博客def count_demo(): data = ["life i...原创 2021-12-05 17:16:38 · 1577 阅读 · 0 评论 -
module ‘datetime‘ has no attribute ‘strftime‘
import datetimetime=datetime.time(12,10,20)print(datetime.strftime(time))AttributeError: module 'datetime' has no attribute 'strftime'您的错误module 'datetime' has no attribute 'strftime'表明这不是导入的问题,而是如何调用strftime()方法的问题。strftime()是datetime类上的一个方法(它是.原创 2021-11-29 08:50:55 · 7235 阅读 · 0 评论 -
PyEcharts 直角坐标系图表之柱状图/条形图
在入门关卡我们已经使用过柱状图。导入语句如下:from pyecharts.charts import Bar为了方便构造数据,我们还导入了 PyEcharts 提供的虚拟数据包,如下所示:from pyecharts.faker import Faker此外还导入全局变量中的 ThemeType 辅助设置主题类型。from pyecharts.globals import ThemeType具体主题参见主题风格。(定制主题 - pyecharts - A Python Ech原创 2021-11-26 13:43:22 · 1551 阅读 · 0 评论 -
matplotlib画三维图
matplotlib画三维图要画三维图需要先导入from mpl_toolkits import mplot3d。导入这个子模块后,就可以在创建任意一个普通坐标轴的过程中添加projection='3d'参数,从而创建一个三维坐标轴。三维图的优点是在notebook中可以交互浏览。from mpl_toolkits import mplot3dimport matplotlib.pyplot as pltfig = plt.figure()ax = plt.axes(project原创 2021-11-14 20:56:59 · 10668 阅读 · 1 评论 -
Seaborn
用Seaborn做可视化即使matplotlib已经如此强大了,但是不得不承认它不支持的功能还有很多。总结如下: 2.0之前的版本的默认配置样式绝对不是用户的最佳选择; matplotlib的API比较底层。虽然可以实现复杂的统计数据可视化,但是通常都需要写大量的样板代码; matplotlib不支持Pandas的DataFrame数据的可视化,必须先提取每个Series。 对于这些问题的终结者就是seaborn。Seaborn 在 Matplotlib 的基础上开发了一套原创 2021-11-14 20:24:02 · 1266 阅读 · 0 评论 -
2021-11-14
import matplotlibmatplotlib.use("Agg")import matplotlib.pyplot as pltdef student(input_data,input_data1):# ********* Begin *********#plt.figure(figsize=(10, 10))plt.plot(input_data,"--g",label="L1",)plt.plot(input_data1,":r",label="L2")plt.lege.原创 2021-11-14 17:18:01 · 1024 阅读 · 0 评论 -
matplotlib
导入matplotlib和numpy,pandas一样,在导入matplotlib时我们也可以用一些常用的简写形式:import matplotlib as mplimport matplotlib.pyplot as pltpyplot是最常用的画图模块接口,功能非常强大。显示图像开发环境的不同,显示图像的方式也就不一样,一般有三种开发环境,分别是脚本、IPython shell、IPython Notebook。在脚本中使用matplotlib进行可视化时显示图像可以使用pl原创 2021-11-14 17:16:47 · 1305 阅读 · 0 评论 -
2021-11-12
a=pd.DataFrame(np.arange(12).reshape(3,4),columns=['A','B','C','D'],index=['a','b','c'])a.iloc[2,:]=np.nana[3]=np.nanprint(a)print(a.dropna()) A B C D 3a 0.0 1.0 2.0 3.0 NaNb 4.0 5.0 6.0 7.0 NaNc NaN NaN NaN NaN NaNEm.原创 2021-11-14 16:10:23 · 182 阅读 · 0 评论 -
获取nan只能用numpy,不能用pandas
a=pd.Series(['a','b',pd.nan,'d'])AttributeError: module 'pandas' has no attribute 'nan'a=pd.Series(['a','b',np.nan,'d'])print(a)0 a1 b2 NaN3 ddtype: object原创 2021-11-12 20:26:37 · 692 阅读 · 0 评论 -
ignore_index
import pandas as pdfrom IPython.core.display import displaydata={'name':['张三','李四','王五','小明'],'sex':['female','female','male','male'], 'year':[2001,2001,2003,2004],'city':['北京','上海','广州','北京']}df1=pd.DataFrame(data,columns=['name','sex','year','.原创 2021-11-10 21:04:29 · 3639 阅读 · 0 评论 -
collections
命名元组 (namedtuple)Python中提供了基础的不可变数据结构元组tuple,对元组元素的访问需通过索引来完成,对此需要熟记每个下标对应的具体含义。如果元素数量一多,要记清楚这些东西就会比较麻烦了,于是就出现了命名元组namedtuple。创建命名元组命名元组的构造函数接受两个参数typename,field_names:typename:元组的名字 field_names:元组各个元素的名称,也就是属性名称比如:collections.namedtuple("Poin原创 2021-11-03 21:25:49 · 62 阅读 · 0 评论 -
pycharm读取文件路径C:\Users\34935\PycharmProjects\pythonProject
C:\Users\34935\PycharmProjects\pythonProject原创 2021-11-01 20:06:27 · 5360 阅读 · 0 评论 -
numpy 堆叠
stackstack的意思是堆叠的意思,所谓的堆叠就是将两个ndarray对象堆叠在一起组合成一个新的ndarray对象。根据堆叠的方向不同分为hstack以及vstack两种。hstack假如你是某公司的HR,需要记录公司员工的一些基本信息。可能你现在已经记录了如下信息:工号 姓名 出生年月 联系电话 1 张三 1988.12 13323332333 2 李四 1987.2 15966666666 3 王五 19原创 2021-10-11 17:30:03 · 1117 阅读 · 0 评论 -
pandas
Pandas是为了解决数据分析任务而创建的,纳入了大量的库和标准数据模型,提供了高效地操作大型数据集所需的工具。 对于Pandas包,在Python中常见的导入方法如下:from pandas import Series,DataFrameimport pandas as pdPandas中的数据结构 :Series: 一维数组,类似于Python中的基本数据结构list,区别是Series只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。就像数据库中的列数据。 DataF原创 2021-10-10 13:36:05 · 225 阅读 · 0 评论