用于科学数据分析的方法
马林Edvardsson 22年8月23日 11分钟

用于科学数据分析的方法

数据收集是科学的关键组成部分,但要获得任何见解,需要以某种方式分析仔细收集的信息。那么,有哪些不同类型的数据分析呢?出于好奇,我们采访了Marina Axelson-Fisk教授查尔姆斯理工大学数理统计学教授,他描述了一些最常见的方法,如探索性分析、描述性分析和预测分析,以及它们的使用时间。

定性与定量数据分析

在数据和数据分析上下文中经常遇到的一种常见分类是定量分类和定量分类定性的方法。那么,这两个类别之间有什么区别呢?

定量数据——基于测量和数字的数据

阿克塞尔森-菲斯克教授说,在自然科学中,基本上有两类数据——定量数据和定性数据。大多数情况下,你可能会有定量数据。Axelson-Fisk教授继续说:“这是基于测量的数据,其中有测量某些过程、现象或变量的实数。”对于定量数据,即基于测量的数据,您可以使用广泛的分析方法。

收听播客:数据分析基础知识,以及如何充分利用收集到的数据

定性数据-描述性的而不是数值的数据

阿克塞尔森-菲斯克教授说,在其他科学领域,你可能会得到定性数据。这就是数据基于测量和数字。例如,如果你做一个调查,你会有一组答案来分析。受访者可能被要求同意某一说法,可能的答案可能是“我完全不同意”,或“我有点不同意”,等等。

答案不是定量的,但通常用数字来标记它们。如果有5个选项,它们将被标记为1到5。重要的是要记住这些数字只是标签。答案之间可能有等级和顺序,比如“好”,“更好”,“最好”,但“好”和“更好”之间的距离,以及“更好”和“最好”之间的距离对于不同的人来说不一定是一样的,比如你回答或我回答。阿克塞尔森-菲斯克强调说,如果我们把你我进行比较,它们肯定是不一样的。所以即使在你的答案之间保持等距,可能不会,等等。所以,我们只能把答案看成是有顺序的,“最好”永远是“最好”。但你不能做平均值t检验之类的分析然而,根据你想做的事情,还有其他方法可以使用。

探索性分析vs解释性分析

另一个分支是探索性- - -说明Axelson-Fisk教授继续分析。如果你有一个研究问题,你有一个假设,你想验证,然后你做一个解释分析你试图证明或推翻你最初的想法。但如果你是这个领域的新手,你想了解一些东西,比如更多地了解这个过程,你可能不知道它们之间的关系是什么,也不知道要问什么研究问题。在这种情况下,你想找到模式然后你做一个所谓的探索性分析.阿克塞尔森-菲斯克教授解释说,在这种情况下,你需要广泛地收集数据,并试图找到各种模式来制定研究问题。

在这里,我必须指出,如果你做探索性分析,然后制定研究问题,非常重要的是,你不要在同一个数据集上做解释性分析,因为你发现的模式可能对那个样本是正确的,但对整个群体可能不是正确的。所以,为了证明这个假设,你需要画一个新的独立数据集,并对其进行解释性分析,因为你可能认为你证明了一些实际上不正确的东西。阿克塞尔森-菲斯克教授说,这是我们想要避免的。在解释性分析中,你是在检验假设,找出关系。

描述性分析

阿克塞尔森-菲斯克教授说,从数据中得出结论后,你可以做的事情有很多。例如,您可以继续使用描述性分析。在描述性分析中,您将以各种方式可视化数据,例如使用图形和图表。你也可以用不同的方法计算平均值、方差和趋势。这将为您提供数据的概述或摘要。

描述性分析不是结论性的,也就是说,它不会帮助你证明假设,但它对你和你的潜在观众都非常有用,可以说明发生了什么。研究数据的图形表示通常非常有用,可以用于探索性分析和解释性分析,因为它可以帮助您说明和识别趋势,还可以帮助您识别问题和错误。阿克塞尔森-菲斯克教授说,当你向读者展示解释性结果时,将其形象化,帮助他们理解你在说什么,这尤其有用。

预测分析

阿克塞尔森-菲斯克教授说,数据分析的类型可以以多种方式划分,一些不同类别之间可能存在重叠。一个相关的类别是预测分析。在这种类型的分析中,您使用历史数据集来得出结论并对未来或新的数据集进行预测。你也可以在关系中寻找因果关系。你寻找变量之间的相关性或关系,然后你想知道谁依赖谁,也就是依赖的方向。

推理分析

下一步是推理分析.阿克塞尔森-菲斯克教授解释说,这是你从数据中推断结论的地方。这里有很多统计方法和假设检验。通常,使用每种方法都必须满足一些条件,例如观测值必须是独立的、正态分布的等等。因此,了解要使用的方法的要求是什么,并确保满足条件是很重要的,否则就不能相信结果。如果条件不满足,通常有一些方法可以转换数据,使其满足所需的条件。阿克塞尔森-菲斯克教授说,如果这是不可能的,还有其他方法可以使用——有其他条件或不太严格条件的方法。

最常见的事情推理分析就是检验不同类型的假设,阿克塞尔森-菲斯克教授继续说道。你想要比较两个总体,所以你从每个总体中抽取样本然后测试它们之间是否存在差异。当然,你可以有两个以上的总体,然后你可以用方差分析或方差分析检验。或者你想测试关系,所以你可以计算变量之间的相关性。另一种情况是,如果你有一个因果关系,一个变量依赖另一个变量。然后你可以做回归,这就像一个相关,但你实际上有依赖的方向。如果你有时间依赖性,你就有随时间测量的纵向数据。例如,我有一篇关于汽车污染空气的硕士论文。数据是从哥德堡的各个测量站收集的,这些测量站每十分之一秒测量一次。在这种情况下,将存在时间依赖性,这意味着对一个实例的测量取决于前一个实例的值。 I.e., if you have a high value ten seconds before, it's more likely to be high this time as well. This must be considered, and we have something called time series, which is a linear relationship similar to regression, but where you are looking for trends over time and where you take into account that you have dependencies between measurements.

有很多不同类型的假设检验或者检验不同的值,一个样本对其他总体的平均值。然后你有许多其他统计方法Axelson-Fisk教授总结道。

数据分析基础知识,以及如何充分利用收集到的数据

请听完整的采访Axelson-Fisk教授全面了解不同的数据分析方法和数据分析过程,包括需要避免的挑战和陷阱。

播客:数据分析基础知识以及如何最大限度地利用收集到的数据

总结

帖子主题

探索博客

你只触及了表面。

受欢迎的

    存档

    查看所有
    Baidu
    map