Statistiques

 Statistiques

Origin offre un certain nombre d’options pour effectuer une analyse statistique générale, notamment: des statistiques descriptives, des tests d’hypothèse à un ou deux échantillons et une analyse de variance unidirectionnelle et bidirectionnelle (ANOVA). En outre, plusieurs types de graphiques statistiques sont pris en charge, y compris les histogrammes et les graphiques en boîte

Des outils d’analyse statistique avancés, tels que l’ANOVA à mesures répétées, l’analyse multivariée, les courbes des caractéristiques de fonctionnement du récepteur (ROC), les calculs de puissance et de taille d’échantillon, et les tests non paramétriques sont disponibles dans OriginPro.

image

L’application Stats Advisor pose une série de questions, puis suggère l’outil ou l’application approprié pour analyser vos données.

Statistiques descriptives

Origin fournit les outils suivants pour vous aider à résumer vos données continues et discrètes.

Descriptif

image

La tabulation croisée (également connue sous le nom de tableau de contingence) est un tableau pour révéler la distribution de fréquence des variables. Le graphique en mosaïque peut être tracé dans le rapport.

La tabulation croisée (également connue sous le nom de tableau de contingence) est un tableau pour révéler la distribution de fréquence des variables. L’analyse basée sur le tableau peut déterminer s’il existe une relation significative, obtenir la force et la direction de la relation, et mesurer et tester la concordance des données de paires appariées. Il est largement utilisé pour analyser des données catégorielles.

Les fréquences

Fréquence discrète

L’analyse de fréquence discrète est une méthode courante pour analyser des variables discrètes. Il compte la fréquence des données discrètes, y compris le pourcentage et le pourcentage cumulé.

Comptes de fréquence

La fonction calcule les comptages de fréquence pour les données 1D et aide à produire l’histogramme de la manière souhaitée.

Comptage de fréquence 2D / Binning

Un outil utile pour calculer les nombres de fréquences et tracer l’histogramme 2D pour les données 2D / bivariées.

image

La fréquence compte

L’outil consiste à mesurer le nombre de fois qu’une valeur est rencontrée dans chaque casier pour une plage de données. Ensuite, les résultats peuvent être utilisés pour générer un histogramme qui permet plus de personnalisation, comme une étiquette au-dessus des barres ou une taille de bac inégale, etc.

image

L’outil Comptages de fréquences 2D / Binning est similaire aux comptes de fréquences, mais pour les variables à deux dimensions. Avec l’outil, nous pouvons générer un histogramme 2D pour détecter visuellement la distribution des données 2D.

image

Utilisez le test de normalité pour déterminer si les données ont été tirées d’une population normalement distribuée (dans une certaine tolérance). Origin prend en charge six méthodes pour le test de normalité, Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors, Anderson-Darling, K-Squared D’Agostino et Chen-Shapiro

image

L’outil Distribution Fit aide les utilisateurs à examiner la distribution de leurs données et à estimer les paramètres de la distribution

Test de normalité

Un test de normalité est utilisé pour déterminer si les données d’échantillon ont été tirées d’une population normalement distribuée (dans une certaine tolérance).

Six tests de normalité différents sont disponibles dans Origin:

  • Shapiro-Wilk
  • Kolmogorov-Smirnov
  • Lilliefors
  • Anderson-Darling
  • K-Squared D’Agostino
  • Chen-Shapiro

Distribution Fit PRO

Connaître le modèle de distribution des données vous aide à poursuivre la bonne analyse. ou faites une estimation de vos données. le Distribution Fit L’outil aide les utilisateurs à examiner la distribution de leurs données et à estimer les paramètres de la distribution

Coefficient de corrélation PRO

image

L’image affiche l’outil Boîte de dialogue du coefficient de corrélation dans Origin. L’outil prend en charge trois tests, Corrélation r de Pearson, Corrélation de l’ordre de rang de Spearman et Corrélation Tau de Kendall. Et l’utilisateur peut choisir de marquer les corrélations significatives dans le résultat

image

Détection des valeurs aberrantes

Une valeur aberrante est une observation qui est considérablement éloignée du reste des données. Origin fournit deux outils pour aider à détecter les valeurs aberrantes.

image

Deux outils dans Origin peuvent être utilisés pour détecter les valeurs aberrantes dans les données, le test de Grubb et le test Q de Dixon. Le graphique des valeurs aberrantes dans les outils peut aider l’utilisateur à juger visuellement à quel point la valeur aberrante est éloignée des autres observations.

ANOVA

L’analyse de variance (ANOVA) est utilisée pour examiner les différences entre les moyennes des groupes. En plus de déterminer qu’il existe des différences entre les moyens, les outils ANOVA d’Origin fournissent des comparaisons de moyens multiples afin d’identifier les moyens particuliers qui sont différents.

ANOVA unidirectionnelle, bidirectionnelle et tripartite

L’ANOVA à un, deux et trois facteurs considère une conception complètement aléatoire pour une expérience.

ANOVA à un facteur

L’ANOVA à un facteur compare trois niveaux ou plus dans un facteur.

ANOVA bidirectionnelle

L’ANOVA bidirectionnelle est utile pour comparer l’effet de plusieurs niveaux de deux facteurs. L’ANOVA bidirectionnelle est une méthode appropriée pour analyser les principaux effets et interactions entre deux facteurs.

ANOVA à trois voies PRO

L’ANOVA à trois facteurs est pour les effets d’interaction entre trois variables indépendantes sur une variable dépendante continue (c.-à-d. S’il existe une interaction à trois facteurs).

image

Le graphique affiche le tracé Moyenne + SE et le tracé de comparaison des moyennes en anova unidirectionnel. Ils aident à comparer visuellement plusieurs groupes, à déterminer si leurs moyennes sont différentes.

image

L’image affiche les résultats obtenus dans l’outil anova unidirectionnel. le ANOVA globale Le tableau indique une valeur de p inférieure à 0,05, par conséquent au moins deux des quatre groupes ont des moyennes significativement différentes. Il existe également des Test d’homogénéité de variance et Comparaisons de moyens tableau des résultats qui aide à juger si les groupes ont une variance égale et fournit une comparaison par paires.

Mesure répétée ANOVA PRO

La conception de mesures répétées est également appelée conception intra-sujet. Il a les mêmes sujets exécutés dans toutes les conditions.

image

L’ANOVA à mesures répétées est utilisée pour comparer trois moyennes ou plus lorsque tous les sujets sont mesurés dans un certain nombre de conditions différentes.

Les outils ANOVA à mesures répétées dans Origin considèrent trois conceptions possibles:

  • Mesures répétées unidirectionnelles PRO

ANOVA avec un facteur de mesures répétées.

  • Mesures répétées bidirectionnelles PRO

ANOVA avec deux facteurs de mesures répétées.

La conception mixte bidirectionnelle est également connue sous le nom de conception de parcelles séparées bidirectionnelles (SPANOVA). Il s’agit d’une ANOVA avec un facteur de mesures répétées et un facteur inter-groupes.

Comparaison des moyens / tests post-hoc

Les tests de comparaison de moyenne dans ANOVA, également connus sous le nom de tests Post Hoc, sont utiles pour effectuer des comparaisons supplémentaires de sous-ensembles de moyennes.

Les quatre outils ANOVA d’Origine, ANOVA à une et deux voies, ANOVA à mesures répétées un et deux voies, fournissent sept tests de comparaison des moyennes:

  • Tukey
  • Bonferroni
  • Dunn-Sidak
  • Fisher LSD
  • Sheff ‘
  • Holm-Bonferroni
  • Holm-Sidak
image

Une feuille de rapport d’analyse de l’origine, celle-ci créée par l’outil ANOVA à mesures répétées unidirectionnelles. L’image montre deux des graphiques intégrés ouverts pour une édition ultérieure. Modifiez un graphique intégré en double-cliquant sur l’image miniature dans le rapport. Une fois les personnalisations effectuées, replacez les graphiques dans le rapport et visualisez vos modifications.

Tests d’hypothèse paramétrique

image

Origin prend en charge différents modes d’entrée pour les tests d’hypothèse. L’utilisateur n’a pas besoin de transformer ses données avant d’utiliser les outils.

image

L’exemple montre les résultats du test t à deux échantillons, une note de bas de page est fournie dans le (s) tableau (s) pour aider à tirer des conclusions. Origin prend également en charge Test de Welch pour le cas où la variance n’est pas égale.

image

Tests non paramétriques PRO

Les tests non paramétriques sont utiles pour tester si les moyennes ou médianes des groupes sont réparties de la même manière entre les groupes. Dans ces types de tests, nous classons (ou classons dans l’ordre) chaque observation de notre ensemble de données. Les tests non paramétriques sont largement utilisés lorsque vous ne savez pas si vos données suivent une distribution normale ou si vous avez confirmé que vos données ne suivent pas une distribution normale. Pendant ce temps, les tests d’hypothèse sont des tests paramétriques basés sur l’hypothèse que la population suit une distribution normale avec un ensemble de paramètres.

image

Le test de classement signé de Wilcoxon à un échantillon dans Origin permet à l’utilisateur d’examiner la médiane de la population par rapport à une valeur spécifiée. Dans les résultats, une note de bas de page est fournie dans le (s) tableau (s) pour aider à tirer des conclusions.

Échantillons appariés

image
  • Test de classement signé Wilcoxon PRO

Deux échantillons

image
  • Test de Kolmogorov-Smirnov PRO

Plusieurs échantillons indépendants

image
image

Les graphiques montrent les données et les résultats de Friedman ANOVA. L’outil d’Origin peut être utilisé pour comparer au moins trois échantillons associés. C’est une alternative non paramétrique à l’ANOVA à mesure répétée unidirectionnelle.

Analyse multivariée PRO

L’analyse multivariée est un ensemble de techniques utilisées pour analyser des données qui correspondent à plus d’une variable. L’objectif principal de cette analyse est d’étudier comment les variables sont liées les unes aux autres, et comment elles fonctionnent en combinaison pour distinguer plusieurs cas d’observations.

Analyse en composantes principales PRO

L’analyse en composantes principales (ACP) est utilisée pour expliquer la structure de variance-covariance d’un ensemble de variables au moyen de combinaisons linéaires de ces variables. L’ACP est donc souvent utilisée comme technique pour réduire la dimensionnalité.

Analyse de cluster PRO

L’analyse par grappes est utilisée pour construire des groupes plus petits avec des propriétés similaires à partir d’un grand ensemble de données hétérogènes. Cette forme d’analyse est un moyen efficace de découvrir des relations au sein d’un grand nombre de variables ou d’observations.

PRO hiérarchique

Dans cette méthode, les éléments sont regroupés en grappes successivement plus grandes par certaines mesures de similitude ou de distance.

K-signifie PRO

Utilisez le clustering K-means pour classer les observations par K nombre de clusters.

C’est plus rapide que Hierarchical mais l’utilisateur doit connaître le centre de gravité des observations, ou au moins le nombre de groupes à regrouper.

Analyse discriminante PRO

L’analyse discriminante est utilisée pour distinguer des ensembles distincts d’observations et pour attribuer de nouvelles observations à des groupes préalablement définis.

Régression des moindres carrés partiels PRO

La régression des moindres carrés partiels (PLS) est utilisée pour construire des modèles prédictifs lorsqu’il existe de nombreux facteurs hautement colinéaires.

Il y a deux raisons principales pour utiliser PLS:

  • Prédiction
    PLS est le plus couramment utilisé pour construire un modèle prédictif lorsque les informations contenues dans un grand nombre de variables d’origine et qu’elles sont hautement colinéaires.
  • Interprétation
    PLS peut être utilisé pour découvrir des caractéristiques importantes d’un grand ensemble de données. Il révèle souvent des relations qui étaient auparavant insoupçonnées, permettant ainsi des interprétations des données qui peuvent ne pas normalement résulter de l’examen des données.
image

Les moindres carrés partiels dans l’origine sont utilisés pour construire des modèles prédictifs lorsqu’il existe de nombreux facteurs hautement colinéaires. le Diagramme d’importance variable peut aider à juger de l’importance de chaque variable.

image

L’outil d’analyse en composantes principales (ACP) est utilisé pour expliquer la structure de variance-covariance d’un ensemble de variables au moyen de combinaisons linéaires. le parcelle d’éboulis est une aide visuelle utile pour déterminer un nombre approprié de composants principaux. Et le Graphique de chargement et de score peut être utilisé pour interpréter les relations entre les observations et les variables.

image

Un tracé de dendrogramme créé par l’outil d’analyse de cluster hiérarchique, qui peut être utilisé pour lister tous les échantillons et indique à quel niveau de similitude deux clusters ont été joints

image

Un graphique de score canonique créé par l’outil d’analyse discriminante dans OriginPro. Ce graphique peut être utilisé pour classer les observations entre les groupes.

Analyse de survie PRO

L’analyse de survie est largement utilisée dans les biosciences pour quantifier la survie dans une population à l’étude. OriginPro comprend trois tests largement utilisés: l’estimateur Kaplan-Meier (limite de produit), le modèle de risques proportionnels de Cox et l’ajustement de Weibull.

image

Le graphique affiche le tracé de la fonction de survie dans l’estimateur Kaplan-Meier. Un test de log-rank est effectué pour comparer les deux fonctions de survie.

image

L’image affiche une partie des rapports de la régression proportionnelle des risques de Cox, qui est une méthode semi-paramétrique pour prévoir les changements dans le taux de risque avec une variété de covariables fixes.

image

Le Weibull Fit est une méthode de paramètres pour analyser la relation entre la fonction de survie et le temps de défaillance. L’utilisateur peut voir l’estimation des paramètres du modèle de Weibull à partir du tableau de résultats et décider visuellement si les données sont supprimées de la distribution de Weibull de la Diagramme de probabilité de Weibull

Puissance et taille d’échantillon PRO

L’analyse de la puissance et de la taille de l’échantillon est utile aux chercheurs pour concevoir leurs expériences. Il peut calculer la puissance de l’expérience pour une taille d’échantillon donnée, et peut également calculer la taille d’échantillon requise pour des valeurs de puissance données.

Les tests suivants sont disponibles:

  • (PSS) Test t pour échantillons appariés
image

L’analyse de la puissance et de la taille de l’échantillon comprend à la fois l’analyse de la taille de l’échantillon et l’analyse de la puissance. L’analyse de la taille de l’échantillon est utilisée pour déterminer si une expérience est susceptible de fournir des informations utiles avec une taille d’échantillon donnée. Inversement, l’analyse de puissance peut être utile pour déterminer la taille minimale de l’échantillon nécessaire pour produire une expérience statistiquement significative. Le graphique affiche le courbe de puissance pour le test des deux variances.

ROC Curve PRO

image

L’analyse de la courbe ROC peut être utilisée pour tester un diagnostic afin de déterminer si un incident s’est produit ou pour comparer la précision de deux méthodes utilisées pour distinguer les cas malades par rapport aux cas sains.

L’analyse de la courbe ROC (Receiver Operating Characteristic) est principalement utilisée pour les études diagnostiques en chimie clinique, pharmacologie et physiologie. Il a été largement accepté comme outil standard pour décrire et comparer la précision des tests de diagnostic.

Par exemple, vous pouvez utiliser l’analyse de courbe ROC pour tester un diagnostic afin de déterminer si un incident s’est produit ou comparer la précision de deux méthodes utilisées pour distinguer les cas malades des cas sains.

applications

image

L’application de parcelle de comparaison appariée est utilisée pour créer des parcelles de variance avec une marque de différences significatives pour une comparaison par paire. Les options de marque significative comprennent les lettres en haut, l’astérisque avec support et la valeur P avec support. L’application prend en charge ces types de tracé: barre, points de données, diagramme en boîte et dispersion avec barre d’erreur.


Source de l’article

A découvrir