statistische-auswertung

Statistische Auswertung

Wir bieten allen Studenten, Doktoranden und Habilitanden, insbesondere der Fachrichtungen Finanzen und Wirtschaft, Biowissenschaften (Medizin, Sport, o. Ä.), Psychologie und Soziologie, Unterstützung bei der statistischen Auswertung von Daten an. Wir wenden dabei state-of-the art Auswertungsprogramme bzw. Programmiersprachen für die statistische Auswertung an: R, Python und SAS.

Wir sind leidenschaftliche und überzeugte R und Python Statistiker! R und Python sind open-source und kostenfrei, jeder kann sie herunterladen und anwenden. Außerdem sind Sie im Bereich der statistischen Analyse weltweit etabliert und im stetigen Wachstum und Beliebtheit innerhalb von Universitäten und in der Wirtschaft. In diesem Blog werden R und Python mit anderen statistischen Auswertungsprogrammen verglichen.

Ein Paar gängige R libraries die wir oft einsetzen: tidyverse (dplyr, ggplot2, tidyr, purrr), data.table, Hmisc, lme4/nlme, lmtest, glmnet, sandwich, survival, car, rpart, randomForest,e1071, caret, rmarkdown, shiny u.a. Wir arbeiten mit folgenden Python libraries: numpy, scipy, pandas, statsmodels, sklearn, matplotlib, seaborn, tensorflow, keras. Und mit folgenden SAS Paketen: Base, STAT, GRAPH, OR, QC, ETS, IML, SAS Enterprise Guide.

Wir helfen Studierenden nicht nur bei der statistischen Auswertung, sondern auch bei technischen Datenvorbereitungen (Datenextraktionen, Transformationen, Missing Values, Outlier u.s.w.), bei der Programmierung, bei der Anwendung und Testen von bereits programmierten Skripten oder bei der Fehlerbehebung von bereits programmierten R, Python oder SAS Skripten.

Durch das Anwenden von besonderen, didaktischen und technischen Methoden ist unsere Unterstützung bei statistischen Auswertungen innerhalb von Abschlussarbeiten oder Publikationen akademisch einwandfrei.

Angewandte statistische Verfahren in der statistischen Auswertung

Design of Experiments, Sampling Verfahren (simple random sampling, stratified random sampling, multistage random sampling usw), Fallzahlplanung (in Bezug auf SE, CV, MOE, Power), deskriptive Statistik, Visualisierung der Daten, Outlier Analyse, Missing Values Analyse, Transformationen, statistische Tests (t-tests, Wilcoxon-Mann-Whitney, Chi²-Tests, Fisher u.a.), Konfidenzintervalle, Toleranzintervalle, Korrelationen (Pearson, Spearman, Kendall, partielle u.a.), Lineare Modelle, Varianzanalyse, ANOVA, gemischte Modelle, GLM, Prozeduren für multiple Vergleiche, lineare Regression, multiple Regression, robuste Regression (z.B. Sandwich-Schätzer), gewichtete Regression, logistische Regression, Poisson Regression, nichtlineare Regression, nichtparametrische Verfahren, Überlebenszeitanalyse, Hauptkomponentenanalyse, Faktorenanalyse, Structural-Equation-Modeling u.a.

Machine Learning und Data Science 

Assoziationsanalyse, Warenkorbanalyse, Hauptkomponentenanalyse, Faktorenanalyse, Cluster Analyse, Feature extraction, Entscheidungsbäume, Random Forests, AdaBoost, Gradient Boosting, logistische Regression, LM, Regularization, Ridge, LASSO, LAR, Neuronale Netze, Deep Learning, Support Vector Machines, Modellauswahl und kostenbasierte Entscheidungen, Feature Importance, ROC und Lift Charts, Predictive dependency plots, ICE plots, Scoring und Vorhersage.

Zeitreihenanalyse

Exponential smoothing, ARIMA Modelle, Box-Jenkins Zeitreihenanalyse, autoregressive error models usw.

Wir freuen uns auf Ihre Statistiken!