大家好,我是小小今天呢,继续分享SPC相关的统计方面的知识点《SPC数据类型的区别》。首先统计分析的基础是数据,数据可以分为两大类,一类是离散型数据,一类是连续型数据。
在制造型企业里面,离散性数据也有时候也叫做计数型数据,连续型数据也叫计量型数据。
连续型数据就是任意无限细分的数据,只要测量仪器精度精度足够,它就可以显示小数点后无限位次,而离散型这些数据它不能细分,通常只能学整数值以及指定的数值!
我来举个例子,就比如说现在的超市里,一般有两种食品销售方式一种是散装的销售,顾客自己挑拣,然后装袋儿,然后去按照食品的重量计算价格。
比如说买鸡蛋,每公斤是大概六块钱,那么我买完之后去称一下重,称重是2.5公斤。还有一种方式是包装销售顾客他不用挑拣装袋,只需要按照食品的包装单位来计算价格。
比如说一盒鸡蛋30元,食品的重量就是连续性的数据,只要称精度够的话,它可以小数点号很多位。但是食品的包装单位就是离散性数据了,因为我只能买一盒、两盒、三盒,想买个半盒,对不起,我们不卖给你。
那么在制造型企业里面,部件的这个尺寸测量值,它就是一般是属于连续型数据的,而通指规,它判定的合格不合格,还有等级的优良差,以及它们对应的数量,这属于离散型数据。这里要有一个注意点,测量仪器和这个测量方法,有时候会影响输出数据的类型,有时候会导致数据同计量型数据降级,说白了就是分辨率太低了。
还有一种情况就是检验员测量了部件尺寸以后,没有记录具体的尺寸数据,用合格不合格来表示,这种情况下都是把它搞成了离散型数据了。那么只要条件允许,尽量还是优先的选择能够获得连续型数据的测量方法。
另外连续型数据也是更有优势的,大家可以只用少量的数据来进行分析,而离散型数据需要大量的数据才能够分析结果,不方便的。
那么定类数据仅仅是具有类别属性,信息量最少。即使是转化成代码或者比较大小,加减乘除也都是没有意义的。
比如我们说这个产品合格或者不合格,产品的型号是多少,有的或者给它定义成编码,或者说是分成类别,都是没有办法进行比较大小和加减乘除的。
那么对于这个定类数据,我们重点关注的是计数,也就是统计每个类别的具体数量。
比如我们说不合格品有多少个?还有它占比百分之多少,这也是有用的。那这个定序数据和定类数据相比,数据具有顺序的属性。也就是不仅能够分类,它还可以判断大小。
比如说考试的名次,第一名、第二名还有这个优良差,评级,还有比如说现在这个高温预警、红色预警,蓝橙色预警、蓝色预警等等,定序数据它具有顺序的性质,但是不具有距离的性质,计算差值是没有意义的。像这个成绩排名,还有警报等级等等,他们评级之间计算差值没有什么用。
那么连续性数据,可以分为定距数据和定比数据,这个定序数据,它数据具有顺序的属性和距离的属性,定矩数据可以比大小,同时计算差值是有意义的,但是它仍然不具有倍数的意义,
比如说摄氏温度,二月份的温度,比如说是两度两摄氏度,一月份的摄氏温度是一摄氏度。我们可以说二月份的温度比1月份的温度升高了一度,但是我们不能说二月份的温度是一月份温度的两倍。
还有一种像智商的评级,小明的智商评分90分,小刚的智商评分是45分,我们说到小明的智商比小刚的智商高了一倍,这是不对的,定距数据的特点。
那最后就是这个定比数据,观测值,它不但具有顺序的距离,顺序和距离的这种属性,它同时还增加了比例的属性。有个定比数据,它比大小、计算差值、计算比例,这些都是有意义的。所以这个定比数据它包含的这个信息量是最大的,数据等级量也是最高的。
比如说我们说这个开始温度,它这个零度,表示这个分子当时说是静寂不动了!这种情况下的时候,这个开始温度就可以计算倍数。我们说1000K它就是比这个500K上升了一倍,这种说法正确。
再比如说机械加工尺寸,这个长度100毫米和50毫米做比较,我们可以说100毫米比50毫米多了50毫米,也可以说100毫米比50毫米是它的两倍,这都是有意义的。
这里为这四类数据类型,这里是有一个规律,就是越靠上的这个数据等级越低,包含的信息量也越少,越靠下的数据等级越高,包含的信息量也就越多,这是一个数据的概念。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
控球28开!泰山半场数据:射门8-10,射正4-3,控球率19%-81%
单位领导整顿考勤纪律,让退二线老同事打卡上班,反被老同志赶走!新领导用这招让大家愣住了
3000余箱磁吸春联滞销,浙江金华一工厂损失数十万 市场监管部门:属企业自主经营行为,应提前做好市场预判
股票私募加仓过年押中节后行情 A股未来可看高一线年人民币汇率可能性的三点思考
Nothing Phone 2a 渲染图现身 让我们一睹预算级王者的真容