箱线图怎么画

箱线图
箱线图,也称为盒须图、盒图或盒图,是一种用于显示一组数据分散情况的统计图 。以盒子的形状命名 。经常用在各个领域 。主要用于反映原始数据的分布特征,也可以比较多组数据的分布特征 。方框图的绘制方法是:先找出一组数据的上限值、下限值、中位数(q2)和下四分位数(q1)以及上四分位数(q3);然后,连接两个四分位数画出方框;然后用方框连接比较大值和比较小值,中间值在方框中间 。
中位数:将数据从小到大排序,那么中间的值就是中位数 。如果数据个数是偶数,那么中间两个数的平均值就是中位数 。上下四分位数:数据按相同顺序排列后,数据平均分为4部分 。出现在25%位置的数称为下四分位数,出现在75%位置的数称为上四分位数 。然而,确定四分位数位置的方法并不固定 。算法有几种,每种方法得到的结果都会不一样,但是差别不会很大 。
上限和下限的计算规则是:iqr=q3-q1上限=q3 1.5iqr下限=q1-1.5iqr
使用matplotlib绘制箱线图:
在matplotlib中,有plt.boxplot来绘制箱线图,该方法的相关参数如下:
x:要绘制的箱线图的数据 。
notch:是否显示置信区间;默认值为假 。如果设置为“真”,框中将显示一个间隙 。
sym:异常点的符号表示,默认为小点 。
垂直:无论是否垂直,默认为真,如果设置为假,将水平显示 。
维斯:上下限值的系数,默认为1.5,即q3上限为1.5iqr,可以更改为其他值 。也可以是序列 。如果是序列,序列中的两个值分别代表下限和上限,而不是由iqr计算的 。
位置:设置每个盒子的位置 。
宽度:设置每个盒子的宽度 。
标签:每个盒子的标签 。
均值线和showmeans:如果两者都为true,则绘制平均值的线 。
示例代码如下:
data=http://www.huobaoweishang.com/zhishi/np. rand. rand(100)* 100
#添加两个异常值data=http://www.huobaoweishang.com/zhishi/np.append(data,np.array([-100,100])
plt.boxplot(数据,平均值=真,显示平均值=真)
效果图如下:
箱线图的应用场景:
直观清晰地识别数据中的异常值 。
用箱线图判断数据的偏度 。
用方框图比较几批数据的形状 。
【箱线图怎么画】箱线图适合比较多组数据 。如果知识依赖于一组数据的分布,建议使用直方图 。