一、语法
在直方图中, data_frame的行被分组到一个矩形标记中,以可视化该值的聚合函数histfunc(例如计数或总和)的一维分布。
plotly.express.histogram(data_frame=None,
x=None,
y=None,
color=None,
pattern_shape=None,
facet_row=None,
facet_col=None,
facet_col_wrap=0,
facet_row_spacing=None,
facet_col_spacing=None,
hover_name=None,
hover_data=None,
animation_frame=None,
animation_group=None,
category_orders=None,
labels=None,
color_discrete_sequence=None,
color_discrete_map=None,
pattern_shape_sequence=None,
pattern_shape_map=None,
marginal=None,
opacity=None,
orientation=None,
barmode='relative',
barnorm=None,
histnorm=None,
log_x=False,
log_y=False,
range_x=None,
range_y=None,
histfunc=None,
cumulative=None,
nbins=None,
text_auto=False,
title=None,
template=None,
width=None,
height=None)
二、参数
-
data_frame ( DataFrame或类似数组的或dict ) – 需要传递此参数才能使用列名(而不是关键字名)。Array-like 和 dict 在内部转换为 pandas DataFrame。可选:如果缺少,则使用其他参数在后台构建 DataFrame。
-
x ( str或int或Series或array-like ) – 中的列名data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于在笛卡尔坐标中沿 x 轴定位标记。如果 orientation是’h’,这些值将用作 的输入histfunc。或者可以是列引用列表或 array_likes 列表,在这种情况下,数据将被视为“宽”而不是“长” x。y
-
y(str或int或Series或array-like)– 中的列名data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于在笛卡尔坐标中沿 y 轴定位标记。如果 orientation是’v’,这些值将用作 的输入histfunc。或者可以是列引用列表或 array_likes 列表,在这种情况下,数据将被视为“宽”而不是“长” x。y
-
color(str或int或Series或array-like)– 中的列名data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于为标记分配颜色。
-
pattern_shape(str或int或Series或array-like)- 中的列名称data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于将图案形状分配给标记。
-
facet_row ( str或int或Series或array-like ) – 中的列名data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于在垂直方向上为多面子图分配标记。
-
facet_col ( str或int或Series或array-like ) – 中的列名data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于在水平方向上为多面子图分配标记。
-
facet_col_wrap ( int ) – 最大分面列数。以该宽度包装列变量,以便列分面跨越多行。如果为 0,则忽略,如果设置facet_row了或 a ,marginal则强制为 0。
-
facet_row_spacing ( float between 0 and 1 ) – 分面行之间的间距,以纸张为单位。使用 facet_col_wrap 时,默认值为 0.03 或 0.0.7。
-
facet_col_spacing ( float between 0 and 1 ) – 分面列之间的间距,以纸张为单位默认为 0.02。
-
hover_name(str或int或Series或array-like)- 中的列名data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值在悬停工具提示中以粗体显示。
-
hover_data ( list of str or int , or Series or array-like , or dict ) – 或者 pandas Series 中的列名列表data_frame,或者是 array_like 对象或者以列名作为键的 dict,值为 True (默认为格式)False(为了从悬停信息中删除此列)或格式字符串,例如 ‘:.3f’ 或 ’ | %a’ 或类似列表的数据出现在悬停工具提示中,或带有布尔或格式化字符串的元组作为第一个元素,以及类似列表的数据作为第二个元素出现在悬停中 这些列中的值在悬停工具提示中显示为额外数据.
-
animation_frame ( str或int或Series或array-like ) – 中列的名称data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于为动画帧分配标记。
-
animation_group ( str或int或Series或array-like ) – 中的列名data_frame,或者 pandas Series 或 array_like 对象。此列或 array_like 中的值用于提供跨动画帧的对象恒定性:具有匹配
animation_group
的行将被视为描述每个帧中的相同对象。 -
category_orders(带有 str 键和 str 值列表的字典(默认{}))——默认情况下,在 Python 3.6+ 中,轴、图例和构面中的分类值的顺序取决于这些值第一次遇到的顺序data_frame(并且没有在低于 3.6 的 Python 中默认保证顺序)。此参数用于强制对每列的值进行特定排序。此 dict 的键应对应于列名,值应是与所需的特定显示顺序相对应的字符串列表。
-
labels(带有 str 键和 str 值的字典(默认{}))——默认情况下,列名在图中用于轴标题、图例条目和悬停。这个参数允许它被覆盖。此 dict 的键应对应于列名,值应对应于要显示的所需标签。
-
color_discrete_sequence ( list of str ) – 字符串应该定义有效的 CSS 颜色。当color设置为 且对应列中的值不是数字时,该列中的值通过color_discrete_sequence 按 中描述的顺序循环分配颜色category_orders,除非 的值 color是 中的键color_discrete_map。子模块中提供了各种有用的颜色序列plotly.express.colors,特别是plotly.express.colors.qualitative.
-
color_discrete_map (dict with str keys and str values (default {})) – 字符串值应该定义有效的 CSS-colors 用于覆盖 color_discrete_sequence以将特定颜色分配给与特定值对应的标记。中的键color_discrete_map应该是由 表示的列中的值color。或者,如果 的值color是有效颜色,则’identity’可以传递字符串以直接使用它们。
-
pattern_shape_sequence ( list of str ) – 字符串应该定义有效的 plotly.js 模式形状。设置时 pattern_shape,该列中的值通过pattern_shape_sequence按 中描述的顺序循环分配模式-形状category_orders,除非 的值pattern_shape是 中的键pattern_shape_map。
-
pattern_shape_map(带有 str 键和 str 值的字典(默认{}))- 字符串值定义 plotly.js 模式形状。用于覆盖 pattern_shape_sequences以将特定图案形状分配给与特定值对应的线条。中的键pattern_shape_map应该是由 表示的列中的值pattern_shape。或者,如果 的值pattern_shape是有效的模式形状名称,则’identity’可以传递字符串以使它们直接使用。
-
marginal( str ) – ‘rug’、‘box’、‘violin’或中的一个’histogram’。如果设置,则在主图旁边绘制一个子图,以可视化分布。
-
opacity ( float ) – 介于 0 和 1 之间的值。设置标记的不透明度。
-
orientation(str,‘h’水平或’v’垂直之一。) - (默认’v’如果提供 和x并且y都连续或都分类,否则’v’
('h' )是分类和 )是连续的,否则提供'h' )) if
x(
yy(
x’v’() if only
x(
y -
barmode (str (default ‘relative’)) –或者在模式中’group’,条形堆叠在零之上表示正值,低于零表示负值。在模式下,条形图相互叠加。在模式下,条形图彼此并排放置。‘overlay’‘relative’‘relative’‘overlay’‘group’
-
barnorm (str (default None)) --‘fraction’或之一’percent’。如果’fraction’,则每个条的值除以该位置坐标处所有值的总和。 'percent’相同,但乘以 100 以显示百分比。 None将在每个位置坐标处堆叠所有值。
-
histnorm (str (default None)) – 、 、 或 If 之一’percent’,'probability’的’density’输出按原样使用。如果 ,则给定 bin 的输出除以所有 bin 的输出之和。如果,则给定 bin 的输出除以所有 bin 的输出之和并乘以 100。如果 ,则给定 bin 的输出除以 bin 的大小。如果,则对给定箱的输出 进行归一化,使其对应于其分布由输出描述的随机事件将落入该箱的概率。'probability density’Nonehistfunc’probability’histfunchistfunc’percent’histfunchistfunc’density’histfunc’probability density’histfunchistfunc
-
log_x (boolean (default False)) – 如果True是,x 轴在笛卡尔坐标中按对数缩放。
-
log_y (boolean (default False)) – 如果True是,y 轴在笛卡尔坐标中按对数缩放。
-
range_x (两个数字的列表) – 如果提供,则覆盖笛卡尔坐标中 x 轴上的自动缩放。
-
range_y (两个数字的列表) – 如果提供,则覆盖笛卡尔坐标中 y 轴上的自动缩放。
-
histfunc (str (‘count’如果没有提供参数,则为默认值,否则’sum’)) – 、 、 、 或 .Function 之一’count’,‘sum’用于’avg’聚合’min’值’max’以进行汇总(注意:可以用 标准化 histnorm)。此函数的参数是y
(
x) 如果orientation是’v’('h'
) 的值。 -
cumulative(boolean (default False)) – 如果True,直方图值是累积的。
-
nbins ( int ) – 正整数。设置 bin 的数量。
-
text_auto (bool or string (default False)) – If Trueor a string, x or y or z 值将显示为文本,具体取决于方向 A string like’.2f’将被解释为texttemplate数字格式指令。
-
title ( str ) – 图形标题。
-
template(str或dict或plotly.graph_objects.layout.Template 实例)–图形模板名称(必须是 plotly.io.templates 中的键)或定义。
-
width (int (default None)) – 图形宽度(以像素为单位)。
-
height (int (default None)) – 以像素为单位的图形高度。
三、返回值
plotly.graph_objects.Figure