Statistische Auswertung
Wir bieten Studierenden, Doktorandinnen, Habilitanden und erwachsenen Lernenden, insbesondere der Fachrichtungen Finanzen und Wirtschaft, Biowissenschaften (Medizin, Sport, o. Ä.), Psychologie und Soziologie, Beratung bei der statistischen Auswertung von Daten an. Wir wenden dabei state-of-the art Programmiersprachen für die statistische Auswertung an: R und Python.
Wir sind leidenschaftliche und überzeugte R und Python Statistiker! R und Python sind open-source und kostenfrei, jeder kann sie herunterladen und anwenden. Außerdem sind sie im Bereich der Datenanalyse weltweit etabliert und im stetigen Wachstum und Beliebtheit innerhalb von Universitäten und in der Wirtschaft. In diesem Blog werden R und Python mit anderen statistischen Auswertungsprogrammen verglichen.
Ein Paar gängige R libraries die wir oft einsetzen: tidyverse (dplyr, ggplot2, tidyr, purrr), data.table, Hmisc, lme4/nlme, lmtest, glmnet, sandwich, survival, car, rpart, randomForest,e1071, caret, xts, zoo, VLMC, forecast, rmarkdown, shiny u.a. Wir arbeiten mit folgenden Python libraries: numpy, scipy, pandas, statsmodels, sklearn, matplotlib, seaborn, tensorflow, keras.
Wir helfen Studierenden nicht nur bei der statistischen Auswertung, sondern auch bei technischen Datenvorbereitungen (Datenextraktionen, Transformationen, Missing Values, Outlier u.s.w.), bei der Programmierung, bei der Anwendung und Testen von bereits programmierten Skripten oder bei der Fehlerbehebung von bereits programmierten R oder Python Skripten.
Durch das Anwenden von besonderen, didaktischen und technischen Methoden ist unsere Beratung bei statistischen Auswertungen innerhalb von Abschlussarbeiten sowohl akademisch als auch ethisch einwandfrei. Sprechen Sie uns an.
Angewandte statistische Verfahren in der statistischen Auswertung
Design of Experiments, Sampling Verfahren (simple random sampling, stratified random sampling, multistage random sampling usw), Fallzahlplanung (in Bezug auf SE, CV, MOE, Power), deskriptive Statistik, Visualisierung der Daten, Outlier Analyse, Missing Values Analyse, Transformationen, statistische Tests (t-tests, Wilcoxon-Mann-Whitney, Chi²-Tests, Fisher u.a.), Konfidenzintervalle, Toleranzintervalle, Korrelationen (Pearson, Spearman, Kendall, partielle u.a.), Lineare Modelle, Varianzanalyse, ANOVA, gemischte Modelle, GLM, Prozeduren für multiple Vergleiche, lineare Regression, multiple Regression, robuste Regression (z.B. Sandwich-Schätzer), gewichtete Regression, logistische Regression, Poisson Regression, nichtlineare Regression, nichtparametrische Verfahren, Überlebenszeitanalyse, Hauptkomponentenanalyse, Faktoranalyse, CFA, EFA, Structural-Equation-Modeling u.a.
Neu: Unsere Statsomat Apps für automatische Datenanalyse. Mehr …
Machine Learning und Data Science
Assoziationsanalyse, Warenkorbanalyse, Hauptkomponentenanalyse, Faktorenanalyse, Cluster Analyse, Feature extraction, Entscheidungsbäume, Random Forests, AdaBoost, Gradient Boosting, logistische Regression, LM, Regularization, Ridge, LASSO, LAR, Neuronale Netze, Deep Learning, Support Vector Machines, Modellauswahl und kostenbasierte Entscheidungen, Feature Importance, ROC und Lift Charts, Predictive dependency plots, ICE plots, Scoring und Vorhersage.
Time Series (Zeitreihenanalyse)
Exponential smoothing, Autoregressive models, Moving Average Models, Vector Autoregression, State Space Models, VLMC, Machine Learning for Time Series, Deep Learning for Time Series e.g. LSTM