Cursos de Estadísticas

Estadísticas Training

Capacitación en Estadísticas Aplicadas.

Testi...Client Testimonials

Minitab for Statistical Data Analysis

Had a good mix of interactions and examples for all skill ranges.

The course was exactly what i was looking for in an introduction to minitab. in addition i got a statistics refresher in statistics theory as well. which was a bonus.

Desmond Erickson - EVRAZ Inc. NA.

Applied Machine Learning

ref material to use later was very good.

PAUL BEALES- Seagate Technology.

Modelling and Forecasting for Government

The material covered was interesting and the trainer was knowledgable

Neghat Khan - Capita Business Services Ltd

Modelling and Forecasting for Government

good rapport with the audience, good & accessible explanation/presentation and he relates 'techy' stuff to real life examples which makes things easier to understand

Ray Rusike - Capita Business Services Ltd

Modelling and Forecasting for Government

Excellent knowledge of the trainer, useful examples

Jonathan Harrison - Capita Business Services Ltd

Modelling and Forecasting for Government

The topics were relevant to my role and I will be able to use this immediately in my work and in future.

Rani Nandra - Capita Business Services Ltd

Predictive Modelling with R

He was very informative and helpful.

Pratheep Ravy - UPC Schweiz GmbH

Tableau Advanced

Trainer's helping.

Urszula Kuza - UBS Business Solutions Poland Sp. z o.o.

Minitab for Statistical Data Analysis

the training was adaptable and personalised to our needs

Dominique Soulie - BAE Systems Surface Ships Ltd

Applied Machine Learning

ref material to use later was very good

PAUL BEALES - Seagate Technology

Tableau Advanced

exercises as it's the only way to learn, by repitition

David Rushe - PaddyPower Betfair

Data Mining & Machine Learning with R

The trainer was so knowledgeable and included areas I was interested in

Mohamed Salama - Edmonton Police Service

Data Mining with R

very tailored to needs

Yashan Wang - MoneyGram International

Introduction to R

Working with 1:1 with Gunnar.

Bryant Ives - EY

Modelling and Forecasting for Government

A very coherent and systematic refresher on forecasting models and useful applications.

Marco D'Alterio - Capita Business Services Ltd

Modelling and Forecasting for Government

Stats refresher and using software for exercises

Rabeeah Shah - Capita Business Services Ltd

Data Mining and Analysis

I like the exercices done

Nour Assaf - Murex Services S.A.L (Offshore)

Data Mining and Analysis

The hands on exercise and the trainer capacity to explain complex topics in simple terms

youssef chamoun - Murex Services S.A.L (Offshore)

Modelling and Forecasting for Government

I learned about a lot of techniques I didn't know about before.

Alexandra Torok - Capita Business Services Ltd

Data Mining and Analysis

The information given was interesting and the best part was towards the end when we were provided with Data from Murex and worked on Data we are familiar with and perform operations to get results.

Jessica Chaar - Murex Services S.A.L (Offshore)

Administrator Training for Apache Hadoop

Trainer give reallive Examples

Simon Hahn - OPITZ CONSULTING Deutschland GmbH

Administrator Training for Apache Hadoop

Big competences of Trainer

Grzegorz Gorski - OPITZ CONSULTING Deutschland GmbH

Administrator Training for Apache Hadoop

Many hands-on sessions.

Jacek Pieczątka - OPITZ CONSULTING Deutschland GmbH

Neural Network in R

new insights in deep machine learning

Josip Arneric - Faculty of Economics and Business Zagreb

Neural Network in R

We gained some knowledge about NN in general, and what was the most interesting for me were the new types of NN that are popular nowadays.

Tea Poklepovic - Faculty of Economics and Business Zagreb

Neural Network in R

Graphs in R :)))

- Faculty of Economics and Business Zagreb

Statistics Level 2

Flexibility of the trainer

Irina Ostapenko - Dr. Volker Türck Ingenieurbüro

Advanced R

The flexible and friendly style. Learning exactly what was useful and relevant for me

Jenny Tickner - Nestlé

A practical introduction to Data Analysis and Big Data

Willingness to share more

Balaram Chandra Paul - MOL Information Technology Asia Limited

Subcategorías

Programas de los Cursos de Estadísticas

Código Nombre Duración Información General
67795 Numerical Methods 14 horas This course is for data scientists and statisticians that have some familiarity with numerical methods and have at least one programming language from R, Python, Octave, and some C++ options. The emphasis of this course is on the practical aspects of data/model preparation, execution, post hoc analysis and visualization. The purpose of this course is to give a practical introduction in numerical methods to participants interested in applying the methods at work. Sector specific examples are used to make the training relevant to the audience. Topics Covered: curve fitting regression robust regression linear algebra: matrix operations eigenvalue/eigenvectormatrix decompositions ordinary & partial differential equations fourier analysis interpolation & splines
statdm Razonamiento Estadístico para Decisiones Gerenciales 7 horas Este curso ha sido creado para tomadores de decisiones cuya meta principal no es hacer el cálculo y el análisis, sino entenderlos y ser capaces de elegir qué tipo de métodos estadísticos son relevantes en la planificación estratégica de la organización. Por ejemplo, un participante potencial debe tomar la decisión de cuántas muestras se deben recoger antes de que puedan tomar la decisión de si el producto va a ser lanzado o no. Si necesita un curso más largo que cubre los conceptos básicos de pensamiento estadístico tiene un vistazo a 5 días de "Estadísticas para los administradores" de formación. Qué estadísticas pueden ofrecer a los responsables de la toma de decisiones Estadísticas descriptivas Estadísticas básicas - ¿cuál de las estadísticas (por ejemplo, mediana, promedio, percentiles, etc ...) son más relevantes para diferentes distribuciones Gráficos - Importancia de hacer lo correcto (por ejemplo, cómo la forma en que se crea el gráfico refleja la decisión) Tipos de variables - qué variables son más fáciles de manejar Ceteris paribus, las cosas siempre están en movimiento Tercer problema variable - cómo encontrar el verdadero influyente Estadística inferencial Valor de probabilidad - ¿cuál es el significado del valor P Experimento repetido - cómo interpretar resultados repetidos del experimento Recolección de datos - puede minimizar el sesgo, pero no deshacerse de él Comprender el nivel de confianza Pensamiento Estadístico Toma de decisiones con información limitada Cómo comprobar cuánta información es suficiente Priorizando metas basadas en probabilidad y retorno potencial (relación beneficio / costo, árboles de decisión) Cómo se suman los errores Efecto mariposa Cisnes negros ¿Cuál es el gato de Schrödinger y cuál es la manzana de Newton en los negocios Cassandra Problema - cómo medir un pronóstico si el curso de acción ha cambiado Tendencias de gripe de Google - cómo salió mal Cómo hacen las decisiones desfasadas Pronóstico - métodos y practicidad ARIMA Por qué los pronósticos ingenuos suelen ser más sensibles Hasta qué punto debería proyectarse un pronóstico en el pasado? Por qué más datos pueden significar un pronóstico peor? Métodos estadísticos útiles para los tomadores de decisiones Describiendo datos bivariados Datos univariados y datos bivariados Probabilidad Por qué las cosas difieren cada vez que las medimos? Distribuciones normales y errores distribuidos normalmente Estimacion Fuentes independientes de información y grados de libertad Lógica de la Prueba de Hipótesis Lo que se puede probar, y por qué siempre es lo contrario lo que queremos (Falsificación) Interpretación de los resultados de las pruebas de hipótesis Medios de prueba Poder Cómo determinar un buen tamaño de muestra (y barato) Falso positivo y falso negativo y por qué siempre es un trade-off
tableau1 Análisis de Datos con Tableau 14 horas Conexión a varias bases de datos Tipos de conexión de datos Trabajo con fuentes de datos únicas Múltiples fuentes de datos y mezcla de datos Geocodificación de Tableau Mapeo avanzado + uso de imágenes de fondo Visión general de visualizaciones adicionales Dashboards: filtros rápidos, acciones y parámetros Cálculos avanzados Parámetros, cálculos, clasificación, filtrado, etc. Prácticas recomendadas al utilizar la programación de Tableau R
dsbda Ciencia de Datos para Big Data Analytics 35 horas Introducción a Data Science para Big Data Analytics Descripción de Data Science Descripción general de Big Data Estructuras de datos Controladores y complejidades de Big Data El ecosistema Big Data y un nuevo enfoque de análisis Tecnologías clave en Big Data Proceso y problemas de minería de datos Asociación Patrón Minería Agrupación de datos Detección de valores atípicos Clasificación de datos Introducción al ciclo de vida de Data Analytics Descubrimiento Preparación de datos Planificación del modelo Construcción del modelo Presentación / Comunicación de resultados Operacionalización Ejercicio: estudio de caso A partir de este punto, la mayor parte del tiempo de capacitación (80%) se gastará en ejemplos y ejercicios en R y en la tecnología de big data relacionada. Comenzando con R Instalación de R y Rstudio Características del lenguaje R Objetos en R Datos en R Manipulación de datos Problemas de Big Data Ceremonias Comenzando con Hadoop Instalando Hadoop Comprender los modos de Hadoop HDFS Arquitectura MapReduce Visión general de los proyectos relacionados con Hadoop Programas de escritura en Hadoop MapReduce Ceremonias Integrando R y Hadoop con RHadoop Componentes de RHadoop Instalación de RHadoop y conexión con Hadoop La arquitectura de RHadoop Hadoop transmitiendo con R Resolución de problemas de análisis de datos con RHadoop Ceremonias Preprocesamiento y preparación de datos Pasos de preparación de datos Extracción de características Limpieza de datos Integración y transformación de datos Reducción de datos: muestreo, selección de subconjuntos de características, Reducción de dimensionalidad Discretización y binning Ejercicios y estudio de caso Métodos analíticos de datos exploratorios en R Estadísticas descriptivas Análisis exploratorio de datos Visualización - pasos preliminares Visualizando una sola variable Examinando múltiples variables Métodos estadísticos para la evaluación Evaluación de la hipótesis Ejercicios y estudio de caso Visualizaciones de datos Visualizaciones básicas en R Paquetes para la visualización de datos ggplot2, celosía, trama, celosía Formateo de parcelas en R Gráficos avanzados Ceremonias Regresión (Estimación de valores futuros) Regresión lineal Casos de uso Descripcion del modelo Diagnostico Problemas con la regresión lineal Métodos de contracción, regresión de cresta, el lazo Generalizaciones y no linealidad Splines de regresión Regresión polinómica local Modelos aditivos generalizados Regresión con RHadoop Ejercicios y estudio de caso Clasificación Los problemas relacionados con la clasificación Refrescante Bayesiano Naïve Bayes Regresión logística K vecinos más cercanos Algoritmo de árboles de decisión Redes neuronales Máquinas de vectores de soporte Diagnóstico de clasificadores Comparación de los métodos de clasificación Algoritmos escalables de clasificación Ejercicios y estudio de caso Evaluar el rendimiento y la selección del modelo Sesgo, varianza y complejidad del modelo Precisión vs Interpretabilidad Evaluando clasificadores Medidas del rendimiento del modelo / algoritmo Método de validación Hold-out Validación cruzada Algoritmos de aprendizaje de sintonización con paquete caret Visualización del rendimiento del modelo con Profit ROC y curvas de elevación Métodos de conjunto Harpillera Bosques Aleatorios Impulso Aumento de gradiente Ejercicios y estudio de caso Máquinas de vectores de soporte para clasificación y regresión Clasificadores de Margen Máximo Clasificadores de vectores de soporte Máquinas de vectores de soporte SVM para problemas de clasificación SVM para problemas de regresión Ejercicios y estudio de caso Identificar agrupaciones desconocidas dentro de un conjunto de datos Selección de características para la agrupación Algoritmos basados en representativos: k-means, k-medoids Algoritmos jerárquicos: métodos aglomerativos y divisivos Algoritmos de base probabilísticos: EM Algoritmos basados en densidad: DBSCAN, DENCLUE Validación de cluster Conceptos avanzados de clustering Agrupación con RHadoop Ejercicios y estudio de caso Descubriendo conexiones con Link Analysis Conceptos de análisis de enlaces Métricas para analizar redes El algoritmo de Pagerank Búsqueda de tema inducida por hipervínculo Predicción del enlace Ejercicios y estudio de caso Asociación Patrón Minería Modelo de Minería de Patrón Frecuente Problemas de escalabilidad en la minería de patrones frecuentes Algoritmos de fuerza bruta Algoritmo Apriori El enfoque de crecimiento FP Evaluación de las reglas del candidato Aplicaciones de las Reglas de Asociación Validación y prueba Diagnostico Reglas de asociación con R y Hadoop Ejercicios y estudio de caso Construir motores de recomendación Entender los sistemas de recomendación Técnicas de minería de datos utilizadas en los sistemas de recomendación Sistemas de recomendación con el paquete recommenderlab Evaluar los sistemas de recomendación Recomendaciones con RHadoop Ejercicio: motor de recomendación de construcción Análisis de texto Pasos de análisis de texto Recopilación de texto sin formato Bolsa de palabras Frecuencia de términos: frecuencia de documento inverso Determinando Sentimientos Ejercicios y estudio de caso  
xcelsius Xcelsius 14 horas Description: In this Xcelsius Training course, students will use Xcelsius Present to create interactive visualizations for presenting complex data in a simple way, and to conduct analysis to make critical decisions. Students will also create complete dashboards that present business, project, and human resources information, all consolidated and presented in a user-friendly manner. Finally, students will publish dashboards into various file formats such as Adobe Flash, Microsoft Office PowerPoint, Adobe PDF, and also to the web. Objectives: Upon successful completion of this course, students will be able to: Explore the Xcelsius workspace and an already created dashboard. Create simple visualizations. Conduct data analysis using Xcelsius components that give dynamic functionality to the specified data. Create a Project Management dashboard. Create a dashboard to consolidate and present the Human Resources information of an organization. Finalize dashboards and export them to different file formats. Audience: This course is designed for professionals who conduct data analysis and need to present robust and timely data in an interactive display. 1: Getting Started with Xcelsius Explore the Xcelsius Interface Explore a Dashboard 2: Creating Simple and Interactive Visualizations Create a Simple Xcelsius Chart Manage Personal Finance Using Value Box Organize Levels of Information Using Filters Conduct a Comparative Study Using List Builder and Line Chart 3: Conducting Data Analysis Conduct Trend Analysis Using Combo Box Conduct Demand Analysis Using Label Based Menu Conduct a Region Based Demand Analysis Using Maps Forecast Revenue Using Sliders and Gauge 4: Creating a Project Management Dashboard Drill Down the Status of Current Projects Using the Drill Down Function Analyze Resource Efficiency Using Fisheye Picture Menu and Other Tools Analyze Resource Utilization Using Combination Chart 5: Creating a Human Resources Dashboard Create an Organization Dashboard Using Organization Chart Conduct Attrition Analysis 6: Finalizing Dashboards Create a Snapshot Publish Dashboards
rprogadv Programación Avanzada de R 7 horas Este curso es para científicos de datos y estadísticos que ya tienen habilidades básicas de codificación R & C ++ y código R y necesitan habilidades avanzadas de codificación R. El objetivo es impartir un curso práctico de programación avanzada de R a los participantes interesados en aplicar los métodos en el trabajo. Se utilizan ejemplos específicos del sector para que la formación sea pertinente para el público Ambiente de R Programación orientada a objetos en R S3 S4 Clases de referencia Perfiles de rendimiento Manejo de excepciones Depuración del código R Creación de paquetes R Examen de la unidad Codificación C / C ++ en R SEXPRs Llamando dinámicamente bibliotecas de R Escribir y compilar código C / C ++ de R Mejora del rendimiento de R con la biblioteca de álgebra lineal C ++
datama Minería y Análisis de Datos 28 horas Objetivo: Los delegados serán capaces de analizar grandes conjuntos de datos, extraer patrones, elegir la variable correcta que impacte los resultados para que un nuevo modelo se pronostique con resultados predictivos. 1. Preprocesamiento de datos Limpieza de datos Integración y transformación de datos Reducción de datos Discretización y generación de jerarquías de conceptos 2. Inferencia estadística Distribuciones de probabilidad, Variables aleatorias, Teorema del límite central Muestreo Intervalos de confianza Inferencia estadística Evaluación de la hipótesis 3. Regresión lineal multivariante Especificación Selección de subconjuntos Estimacion Validación Predicción 4. Métodos de clasificación Regresión logística Análisis discriminante lineal K-vecinos más cercanos Naive Bayes Comparación de clasificaciones 5. Redes neuronales Adaptación de redes neuronales Entrenamiento de problemas de redes neuronales 6. Árboles de decisión Árboles de regresión Árboles de clasificación Árboles Versus Modelos Lineales 7. Embalaje, Bosques al azar, Impulso Harpillera Bosques al azar Impulsando 8. Soporte de máquinas vectoriales y flexibles disct Clasificador de Margen Máximo Clasificadores de vectores de soporte Soporte de máquinas vectoriales 2 y más clases SVM's Relación con la regresión logística 9. Análisis de componentes principales 10. Clustering K-significa agrupación K-medoids agrupación Agrupación jerárquica Agrupamiento basado en densidad 11. Modelo de Evaluación y Selección Bias, Varianza y Complejidad del Modelo Error de predicción en la muestra El enfoque bayesiano Validación cruzada Métodos de Bootstrap
tidyverse Introduction to Data Visualization with Tidyverse and R 7 horas The Tidyverse is a collection of versatile R packages for cleaning, processing, modeling, and visualizing data. Some of the packages included are: ggplot2, dplyr, tidyr, readr, purrr, and tibble. In this instructor-led, live training, participants will learn how to manipulate and visualize data using the tools included in the Tidyverse. By the end of this training, participants will be able to: Perform data analysis and create appealing visualizations Draw useful conclusions from various datasets of sample data Filter, sort and summarize data to answer exploratory questions Turn processed data into informative line plots, bar plots, histograms Import and filter data from diverse data sources, including Excel, CSV, and SPSS files Audience Beginners to the R language Beginners to data analysis and data visualization Format of the course Part lecture, part discussion, exercises and heavy hands-on practice Introduction     Tydyverse vs traditional R plotting Setting up your working environment Preparing the dataset Importing and filtering data Wrangling the data Visualizing the data (graphs, scatter plots) Grouping and summarizing the data Visualizing the data (line plots, bar plots, histograms, boxplots) Working with non-standard data Closing remarks
sixsigmabb Six Sigma Black Belt 84 horas Six Sigma is a data driven approach that tackles variation to improve the performance of products, services and processes, combining practical problem solving and the best scientific approaches found in experimentation and optimisation of systems. The approach has been widely and successfully applied in industry, notably by Motorola, AlliedSignal & General Electric. Black Belt is a qualification for improvement managers in a Six Sigma organisation. You will learn the tools and techniques to take an improvement project through the Define, Measure, Analyse, Improve and Control phases (DMAIC). These techniques include Process Mapping, Measurement System Evaluation, Regression Analysis, Design of Experiments, Statistical Tolerancing, Monte Carlo Simulation and Lean Thinking. The content of the course takes the participants through the DMAIC phases as well as introducing subjects such as Lean Thinking, Design for Six Sigma and discussing important leadership issues and experiences in deploying a Six Sigma programme. Week 1 Foundation: covers the fundamentals of the Lean Six Sigma Define Measure Analyse Improve Control (DMAIC) approach enabling participants to take part and lead waste and defect reduction projects and initiatives. Week 2 Practitioner: provides additional data analysis and lean tools for participants to lead well scoped process improvement projects related to their regular job function. Week 3 Expert: provides regression, design of experiment and data analysis techniques to enable participants to tackle complex problem solving projects that require understanding of the relationships between multiple variables. The trainer has 16 years experience with Six Sigma and as well as leading the deployment of Six Sigma at a number of businesses he has trained and coached over 300 Black Belts. Here are a few comments from previous participants: “Probably the most valuable course I will ever pass” “The content was very well delivered. The examples very relevant. Thank you” “The course was excellent and I am able to use part of it to coach my lean teams here” (Company supervisor who attended with KTP associate) Block 1 Day 1 Introduction to Six Sigma Project Chartering & VOC Process Mapping Stakeholder analysis Day 2 Team Start Up Prioritisation Matrix Lean Thinking Value Stream Mapping Day 3 Data Collection Minitab and Graphical Analysis Descriptive Statistics Day 4 Measurement System Evaluation Process Capability Cp, CpK Six Sigma Metrics Day 5 5 Why FMEA Block 2 Day 1 Review of Block 1 Multivari Inferential Statistics Intro to Hypothesis Testing Day 2 2 sample t-tests F tests Hypothesis Testing – Chi Sq Day 3 Hypothesis Testing - Anova Day 4 Correlation and Regression Multiple Regression Introduction to Design Of Experiments Day 5 Mistake Proofing Control Plans Control Charts Block 3 Day 1 Review of Block 2 2K Factorial Experiments Box Cox Transformations Hypothesis Testing – Non Parametric Day 2 2K Factorial Experiments Fractional Factorial Experiments Day 3 Noise Blocking Robustness Centre Points General Full Factorial Experiments Day 4 Response Surface Experiments Implementing Improvements Creative Solutions Day 5 Intro to Design for Six Sigma Statistical Tolerancing Monte Carlo Simulation Certification Six Sigma is a practical qualification, to demonstrate knowledge of what has been learnt on the course you will need to undertake 2 coursework projects. There is no report to produce but you will be required to present a PowerPoint presentation to the trainer and examiner showing results and method. The projects can cover work you would complete in your normal work, however you will need to show use of the DMAIC problem solving approach and application of Six Sigma and Lean tools. This provides a good balance between the practical approach and more rigorous analysis which together lead to robust solutions. You will be able to contact the trainer for discussions of how Six Sigma tools could benefit you in your project. Examples of projects from previous participants include: Formulating cream texture for seasonality in dairy feeds. Housing Association complaints reduction Multi-variable (cost, efficiency, size) optimisation of a fuel cell Job Scheduling improvement in a factory Ambulance waiting time reduction Reduction in resin thickness variation in glass manufacture NobleProg & Redlands provide Black Belt certification. For delegates that require independent accreditation, NobleProg & Redlands have partnered with the British Quality Foundation (BQF) to provide Lean Six Sigma Black Belt certification. Certification requires passing an exam at the end of the course and completing and presenting two improvement projects that demonstrate understanding and application of the Six Sigma approach and techniques. An additional charge of £600 plus VAT is levied for BQF independent accreditation.
mlintro Introducción al Aprendizaje Automático 7 horas Este curso de capacitación es para personas que deseen aplicar técnicas básicas de Aprendizaje de Máquinas en aplicaciones prácticas. Científicos de datos y estadísticos que tienen cierta familiaridad con el aprendizaje de máquinas y saben cómo programar R. El énfasis de este curso está en los aspectos prácticos de la preparación de datos / modelos, la ejecución, el análisis post hoc y la visualización. El propósito es dar una introducción práctica al aprendizaje automático a los participantes interesados en aplicar los métodos en el trabajo Se utilizan ejemplos específicos del sector para hacer que la formación sea relevante para el público. Naive Bayes Modelos multinomiales Análisis bayesiano de datos categóricos Análisis discriminante Regresión lineal Regresión logística GLM Algoritmo EM Modelos mixtos Modelos Aditivos Clasificación KNN Regresión de la cresta Clustering
webappsr Creación de Aplicaciones Web en R con Shiny 7 horas Descripción: Este es un curso diseñado para enseñar a los usuarios de R cómo crear aplicaciones web sin necesidad de aprender HTML, Javascript y CSS. Objetivo: Cubre los conceptos básicos de cómo funcionan las aplicaciones brillantes. Cubre todas las funciones de entrada / salida / renderizado / paneles de uso común de la biblioteca brillante. 1. Una visión general de Shiny 2. Instalación de Shiny para uso local 3. Conceptos Básicos Brillantes Accesorios básicos de control - Botones, deslizadores, menús desplegables Estructura del programa ui.r, server.r Construcción de la primera aplicación Ejecución de la aplicación 4. Personalización de la interfaz Enlaces HTML en Shiny JavaScript y brillante 5. Accesorios de control avanzado Mostrar y ocultar elementos de la interfaz de usuario Interfaces dinámicas de usuario Reactividad avanzada Animación Descargando la carga de datos 6. Compartir aplicaciones web brillantes 7. Resumen de las extensiones brillantes
BigData_ A practical introduction to Data Analysis and Big Data 35 horas Participants who complete this training will gain a practical, real-world understanding of Big Data and its related technologies, methodologies and tools. Participants will have the opportunity to put this knowledge into practice through hands-on exercises. Group interaction and instructor feedback make up an important component of the class. The course starts with an introduction to elemental concepts of Big Data, then progresses into the programming languages and methodologies used to perform Data Analysis. Finally, we discuss the tools and infrastructure that enable Big Data storage, Distributed Processing, and Scalability. Audience Developers / programmers IT consultants Format of the course Part lecture, part discussion, hands-on practice and implementation, occasional quizing to measure progress. Introduction to Data Analysis and Big Data What makes Big Data "big"? Velocity, Volume, Variety, Veracity (VVVV) Limits to traditional Data Processing Distributed Processing Statistical Analysis Types of Machine Learning Analysis Data Visualization Languages used for Data Analysis R language Why R for Data Analysis? Data manipulation, calculation and graphical display Python Why Python for Data Analysis? Manipulating, processing, cleaning, and crunching data Approaches to Data Analysis Statistical Analysis Time Series analysis Forecasting with Correlation and Regression models Inferential Statistics (estimating) Descriptive Statistics in Big Data sets (e.g. calculating mean) Machine Learning Supervised vs unsupervised learning Classification and clustering Estimating cost of specific methods Filtering Natural Language Processing Processing text Understaing meaning of the text Automatic text generation Sentiment analysis / Topic analysis Computer Vision Acquiring, processing, analyzing, and understanding images Reconstructing, interpreting and understanding 3D scenes Using image data to make decisions Big Data infrastructure Data Storage Relational databases (SQL) MySQL Postgres Oracle Non-relational databases (NoSQL) Cassandra MongoDB Neo4js Understanding the nuances Hierarchical databases Object-oriented databases Document-oriented databases Graph-oriented databases Other Distributed Processing Hadoop HDFS as a distributed filesystem MapReduce for distributed processing Spark All-in-one in-memory cluster computing framework for large-scale data processing Structured streaming Spark SQL Machine Learning libraries: MLlib Graph processing with GraphX Scalability Public cloud AWS, Google, Aliyun, etc. Private cloud OpenStack, Cloud Foundry, etc. Auto-scalability Choosing the right solution for the problem The future of Big Data Closing remarks
excelstatsda Excel para el Análisis Estadístico de Datos 14 horas Audiencia Analistas, investigadores, científicos, graduados y estudiantes y cualquiera que esté interesado en aprender cómo facilitar el análisis estadístico en Microsoft Excel. Objetivos del Curso Este curso ayudará a mejorar su familiaridad con Excel y las estadísticas y como resultado aumentar la eficacia y la eficiencia de su trabajo o investigación. Este curso describe cómo usar el Analysis ToolPack en Microsoft Excel, funciones estadísticas y cómo realizar procedimientos estadísticos básicos. Explicará las limitaciones de Excel y cómo superarlas.   Agregación de Datos en Excel Funciones estadísticas Contornos Subtotales Tablas dinamicas Análisis de Relación de Datos Distribución normal Estadísticas descriptivas Correlación lineal Análisis de regresión Covariance Analizar Datos en el Tiempo Tendencias / Línea de regresión Lineal, Logarítmica, Polinomial, Potencial, Exponencial, Suavizado de Media Móvil Análisis de fluctuaciones estacionales Comparación de Poblaciones Intervalo de confianza para la media Prueba de hipótesis sobre la media de la población Diferencia entre la media de dos poblaciones ANOVA: Análisis de las Variaciones Prueba de bondad de ajuste para variables aleatorias discretas Prueba de independencia: tablas de contingencia Hipótesis de prueba con respecto a la varianza de dos poblaciones Predicción Extrapolación
datascience Ciencia de Datos 21 horas Data Science Training Aim: Obtaining the required knowledge for application of Data Science methods and also getting consultancy for establishing a Data Science team in an insurance company Order: 2-3 days training and consulting in Data Science: One goal is getting consultancy in the introduction and establishment of Data Science, and the statistical environment R as Data Science tool, within a company / organization. Another goal represents the prediction of typical Key Performance Indicators (KPI) and their confidence intervals with R. Suitable reporting and communication of these KPIs to the management board should be trained also. On the basis of use cases which are derived from actual problems in Actuarial Science and Data Science, the respective methods and their implementation in R should be trained and discussed. Content: 1.) Modelling KPIs 1a.) Based on a use case, the modelling of respective KPI via R shall be discussed. Especially following topics have to be concerned: - Using R as a tool to analyze the performance of insurance portfolios - Suitable data organization within R - Application of Bayesian Theory (preferred using Stan Library in R) - Validation of statistical models - Suitable reporting of KPIs, visualization and communication of models and statistical results to the management board Target group: Data Scientists 2) Establishing a Data Science team within an organization Based on practical experience, it should be taught how to establish a Data Science team and R as a Data Science tool within a larger company. Especially the following topics have to be concerned: - Required hardware and software - Definition of interfaces to other teams (Data Integration / Data Governance / IT) - Standardization (Projects / Coding Styles / Methods) - Information Management - Documentation, reproducibility, allocation of tasks - Networking - Compliance Target group: Data Scientists, management board 3.) Claims reserving with R using state of the art methods Using the ChainLadder R Package, reserving shall be conducted. The focus lies on: - Application of state-of-the-art claims reserving methods including o Basic Chain-Ladder o Mack Chain-Ladder o Generalized linear modelling o Bayesian Approach - Estimation of claim severity in case quickly growing portfolios - Prediction of future claim severity in case of a fixed portfolio - Modelling cancellation Target group: Data Scientists, Actuaries Extent: 2-3 day training / consulting Requirements - in-house training is preferred - Training is based on real-life insurance data / experience
appliedml Aprendizaje Automático Aplicado 14 horas Este curso de capacitación es para personas que deseen aplicar Aprendizaje de la Máquina en aplicaciones prácticas. Audiencia Este curso es para científicos de datos y estadísticos que tienen cierta familiaridad con las estadísticas y saben cómo programar R (o Python u otro idioma elegido). El énfasis de este curso está en los aspectos prácticos de la preparación de datos / modelos, la ejecución, el análisis post hoc y la visualización. El propósito es dar aplicaciones prácticas al Aprendizaje Automático a los participantes interesados en aplicar los métodos en el trabajo. Se utilizan ejemplos específicos del sector para hacer que la formación sea relevante para el público. Naive Bayes Modelos multinomiales Análisis bayesiano de datos categóricos Análisis discriminante Regresión lineal Regresión logística GLM Algoritmo EM Modelos mixtos Modelos Aditivos Clasificación KNN Modelos gráficos bayesianos Análisis Factorial (FA) Análisis de Componentes Principales (PCA) Análisis Independiente de Componentes (ICA) Máquinas de Vector de Soporte (SVM) para regresión y clasificación Impulsando Modelos de Ensemble Redes neuronales Modelos ocultos de Markov (HMM) Modelos del estado espacial Clustering  
rintrob Introducción R para Biólogos 28 horas I. Introducción y preliminares 1. Información general Haciendo R más amigable, R y GUIs disponibles Rstudio Software y documentación relacionados R y estadísticas Uso de R de forma interactiva Una sesión introductoria Obtención de ayuda con funciones y funciones R, sensibilidad de mayúsculas y minúsculas, etc. Recuperación y corrección de comandos anteriores Ejecutar comandos o desviar la salida a un archivo Permanencia de datos y eliminación de objetos Buenas prácticas de programación: guiones autónomos, buena legibilidad, p. Scripts estructurados, documentación, reducción Instalar paquetes; CRAN y Bioconductor 2. Lectura de datos Archivos Txt (read.delim) Archivos CSV 3. Manipulaciones sencillas; Números y vectores + arrays Vectores y asignación Aritmética vectorial Generación de secuencias regulares Vectores lógicos Valores faltantes Vectores de caracteres Vectores índice; Seleccionar y modificar subconjuntos de un conjunto de datos Matrices Indexación de matrices. Subsecciones de una matriz Matrices de índice La función array () + operaciones simples en arrays, p. Multiplicación, transposición Otros tipos de objetos 4. Listas y marcos de datos Liza Construir y modificar listas Concatenar listas Marcos de datos Realización de marcos de datos Trabajar con marcos de datos Adjuntar listas arbitrarias Gestión de la ruta de búsqueda 5. Manipulación de datos Selección, subconjunto de observaciones y variables Filtrado, agrupación Recodificación, transformaciones Agregación, combinación de conjuntos de datos Formando matrices particionadas, cbind () y rbind () La función de concatenación, (), con arrays Manipulación de caracteres, paquete stringr Introducción corta en grep y regexpr 6. Más información sobre la lectura de datos XLS, XLSX archivos Paquetes readr y readxl SPSS, SAS, Stata, ... y otros formatos de datos Exportar datos a txt, csv y otros formatos 6. Agrupación, bucles y ejecución condicional Expresiones agrupadas Declaraciones de control Ejecución condicional: si declaraciones Ejecución repetitiva: para bucles, repetición y Introducir en aplique, aplique, aplique, aplique 7. Funciones Creación de funciones Argumentos opcionales y valores predeterminados Número variable de argumentos Alcance y sus consecuencias 8. Gráficos simples en R Creación de un gráfico Parcelas de densidad Parcelas de puntos Parcelas de Bar Líneas gráficas Gráficos circulares Boxplots Gráfico de dispersión Combinación de parcelas II. Análisis estadístico en R 1. Distribuciones de probabilidad R como conjunto de cuadros estadísticos Examinar la distribución de un conjunto de datos 2. Pruebas de hipótesis Pruebas sobre una media poblacional Prueba de Razón de Verosimilitud Pruebas de una y dos muestras Prueba Chi-Cuadrada de la Bondad de Ajuste Estadística de una muestra de Kolmogorov-Smirnov Wilcoxon Signed-Rank Test Prueba de dos muestras Prueba de suma de rangos de Wilcoxon Prueba de Mann-Whitney Prueba Kolmogorov-Smirnov 3. Pruebas Múltiples de Hipótesis Error de tipo I y FDR Curvas ROC y AUC Procedimientos de Pruebas Múltiples (BH, Bonferroni, etc.) 4. Modelos de regresión lineal Funciones genéricas para extraer la información del modelo Actualización de modelos adaptados Modelos lineales generalizados Familias La función glm () Clasificación Regresión logística Análisis Discriminante Lineal Aprendizaje sin supervisión Análisis de componentes principales Clustering Métodos (k-medios, agrupación jerárquica, k-medoids) 5. Análisis de supervivencia (paquete de supervivencia) Objetos de supervivencia en r Kaplan-Meier, prueba log-rank, regresión paramétrica Bandas de confianza Análisis de datos censurados (intervalo censurado) Modelos Cox PH, covariables constantes Cox PH modelos, covariables dependientes del tiempo Simulación: comparación de modelos (comparación de modelos de regresión)   6. Análisis de la varianza ANOVA unidireccional Clasificación bidireccional de ANOVA MANOVA   III. Problemas de trabajo en bioinformática Breve introducción al paquete limma Flujo de trabajo de análisis de datos de microarrays Descarga de datos de GEO: http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397 Procesamiento de datos (QC, normalización, expresión diferencial) Trama de volcán Custering ejemplos + heatmaps
Piwik Introducción a Piwik 21 horas Audiencia Analista web Analistas de datos Investigación de mercado Profesionales de marketing y ventas Administradores del sistema Formato de curso Conferencia de parte, discusión parcial, práctica práctica intensa   Introducción a Piwik ¿Por qué usar Piwik? Piwik vs Google Analytics Configurando Piwik Seleccionar qué sitios web supervisar Trabajando con el tablero Comprender la actividad del visitante Comportamiento Referencias Generando informes
stats2 Estadísticas Nivel 2 28 horas Este curso de capacitación cubre estadísticas avanzadas. Explica la mayoría de las herramientas comúnmente utilizadas en investigación, análisis y pronóstico. Proporciona breves explicaciones de la teoría detrás de las fórmulas. Este curso no se relaciona con ningún campo específico de conocimiento, pero puede adaptarse si todos los delegados tienen el mismo fondo y objetivos. Algunas herramientas informáticas básicas se utilizan durante este curso (especialmente Excel y OpenOffice) Describiendo Datos Bivariados Introducción a los datos bivariados Valores de la correlación de Pearson Adivinar la simulación de correlaciones Propiedades de la r de Pearson Computación de Pearson Restricción de la demostración de rango Ley de suma de desviación II Ceremonias Probabilidad Introducción Conceptos básicos Demostración Probabilidad Condicional Gamblers Fallacy Simulation Demostración de Cumpleaños Distribución binomial Demostración Binomial Tarifas base Demostración del Teorema de Bayes Demostración del problema de Monty Hall Ceremonias Distribuciones Normales Introducción Historia Áreas de distribución normal Variedades de Demostración de Distribución Normal Estándar Normal Aproximación Normal al Binomio Demostración de aproximación normal Ceremonias Distribuciones de Muestreo Introducción Demostración básica Demostración del tamaño de la muestra Demostración del teorema del límite central Distribución de muestreo de la media Distribución de muestreo de la diferencia entre los medios Distribución de muestreo de r de Pearson Distribución de muestreo de una proporción Ceremonias Estimacion Introducción Grados de libertad Características de los estimadores Simulación de polarización y variabilidad Intervalos de confianza Ceremonias Lógica de la Prueba de Hipótesis Introducción Pruebas de Significancia Errores de Tipo I y Tipo II Pruebas de una y dos colas Interpretación de Resultados Significativos Interpretación de resultados no significativos Pasos en la prueba de hipótesis Pruebas de significación y intervalos de confianza Conceptos erróneos Ceremonias Medios de Prueba Media simple T Demostración de distribución Diferencia entre dos medios (grupos independientes) Simulación de robustez Todas las comparaciones de pares entre medios Comparaciones Específicas Diferencia entre dos medios (pares correlacionados) Simulación correlacionada t Comparaciones Específicas (Observaciones Correlacionadas) Comparaciones de parejas (Observaciones correlacionadas) Ceremonias Poder Introducción Factores que afectan el poder Por qué importa el poder Ceremonias Predicción Introducción a la regresión lineal simple Demostración Linear Fit Partición de sumas de cuadrados Error estándar de la estimación Demostración de línea de predicción Estadísticas inferenciales para b y r Ceremonias ANOVA Introducción Diseños de ANOVA ANOVA de un factor (entre sujetos) Demostración unidireccional ANOVA Multi-Factor (Entre Sujetos) Tamaños de muestra desiguales Ensayos que complementan ANOVA ANOVA dentro de los sujetos Power of Within-Subjects Diseños Demo Ceremonias Chi Square Distribución Chi Square Tablas unidireccionales Prueba de distribuciones Demo Tablas de contingencia Simulación de mesa 2 x 2 Ceremonias
kdd Descubrir Conocimiento en Bases de Datos 21 horas Knowledge discovery in databases (KDD) is the process of discovering useful knowledge from a collection of data. Real-life applications for this data mining technique include marketing, fraud detection, telecommunication and manufacturing. In this course, we introduce the processes involved in KDD and carry out a series of exercises to practice the implementation of those processes. Audience     Data analysts or anyone interested in learning how to interpret data to solve problems Format of the course     After a theoretical discussion of KDD, the instructor will present real-life cases which call for the application of KDD to solve a problem. Participants will prepare, select and cleanse sample data sets and use their prior knowledge about the data to propose solutions based on the results of their observations. Introduction     KDD vs data mining Establishing the application domain Establishing relevant prior knowledge Understanding the goal of the investigation Creating a target data set Data cleaning and preprocessing Data reduction and projection Choosing the data mining task Choosing the data mining algorithms Interpreting the mined patterns
dataminr Minería de Datos con R 14 horas Fuentes de métodos Inteligencia artificial Aprendizaje automático Estadística Fuentes de datos Pre-procesamiento de datos Importación / Exportación de Datos Exploración y visualización de datos Reducción de dimensionalidad Tratar los valores perdidos Paquetes R Tareas principales de minería de datos Análisis automático o semiautomático de grandes cantidades de datos Extracción de patrones interesantes desconocidos anteriormente Grupos de registros de datos (análisis de conglomerados) Registros inusuales (detección de anomalías) Dependencias (minería de reglas de asociación) Minería de datos Detección de anomalías (Detección de valores atípicos / cambios / desviaciones) Aprendizaje de reglas de asociación (Modelado de dependencias) Clustering Clasificación Regresión Resumen Explotación Frecuente de Patrones Extracción de textos Árboles de decisión Regresión Redes neuronales Secuencia de minería Explotación Frecuente de Patrones Dragado de datos, pesca de datos, snooping de datos
bigddbsysfun Big Data & Fundamentos de Sistemas de Bases de Datos 14 horas El curso forma parte del conjunto de habilidades de Data Scientist (Dominio: Datos y Tecnología). Conceptos de Data Warehousing ¿Qué es Data Ware House? Diferencia entre OLTP y Data Ware Housing Adquisición de datos Extracción de datos Transformación de datos. Carga de datos Data marts Dependiente vs Independiente Mart de datos Diseño de la base de datos Conceptos de prueba ETL: Introducción. Ciclo de vida del desarrollo de programas. Metodologías de ensayo. Prueba ETL Proceso de flujo de trabajo. ETL Testing Responsibilities in Data etapa. Fundamentos de datos grandes Big Data y su papel en el mundo corporativo Las fases de desarrollo de una estrategia de Big Data dentro de una corporación Explicar la lógica subyacente de un enfoque holístico de Big Data Componentes necesarios en una plataforma de datos grande Gran solución de almacenamiento de datos Límites de las tecnologías tradicionales Descripción general de los tipos de bases de datos Bases de datos NoSQL Hadoop Mapa reducido Apache Spark
datamodeling Reconocimiento de Patrones 35 horas Este curso proporciona una introducción en el campo del reconocimiento de patrones y el aprendizaje automático. Se trata de aplicaciones prácticas en estadística, informática, procesamiento de señales, visión por computadora, minería de datos y bioinformática. El curso es interactivo e incluye muchos ejercicios prácticos, comentarios de los instructores y pruebas de los conocimientos y habilidades adquiridos. Audiencia      Analistas de datos      Estudiantes de doctorado, investigadores y profesionales Introducción Teoría de la probabilidad, selección del modelo, teoría de la decisión e información Distribuciones de probabilidad Modelos lineales para regresión y clasificación Redes neuronales Métodos Kernel Máquinas kernel esparcidas Modelos gráficos Modelos de mezcla y EM Inferencia aproximada Métodos de muestreo Variables latentes continuas Datos secuenciales Combinando modelos
stats1 Estadísticas Nivel 1 14 horas Este curso ha sido creado para personas que requieren habilidades de estadísticas generales. Este curso puede ser adaptado a un área específica de experiencia como investigación de mercado, biología, fabricación, investigación del sector público, etc ... Introducción Estadísticas descriptivas Estadística inferencial Demostración de muestreo Variables Percentiles Medición Niveles de medición Demostración de Medición Fundamentos de la recopilación de datos Distribuciones Notación de suma Transformaciones lineales Ceremonias Representación Gráfica de las Distribuciones Variables Cualitativas Variables Cuantitativas Muestras de tallos y hojas Histogramas Polígonos de Frecuencia Boxplots Demostración del diagrama de caja Gráfica de barras Gráficos de línea Ceremonias Resumir las Distribuciones Tendencia central Qué es Central Tendency? Medidas de tendencia central Simulación de escala de balanza Simulación de diferencias absolutas Simulación de diferencias cuadráticas Mediana y media Simulación media y mediana Medidas Adicionales Medidas de comparación Variabilidad Medidas de Variabilidad Estimación de la simulación de varianza Forma Demostración de comparaciones de distribuciones Efectos de las transformaciones Ley de sumas de desviación I Ceremonias Distribuciones Normales Historia Áreas de distribución normal Variedades de Demostración de Distribución Normal Estándar Normal Aproximación Normal al Binomio Demostración de aproximación normal Ceremonias
druid Druid:Construir un Sistema Rápido y en Tiempo Real de Análisis de Datos 21 horas Druid is an open-source, column-oriented, distributed data store written in Java. It was designed to quickly ingest massive quantities of event data and execute low-latency OLAP queries on that data. Druid is commonly used in business intelligence applications to analyze high volumes of real-time and historical data. It is also well suited for powering fast, interactive, analytic dashboards for end-users. Druid is used by companies such as Alibaba, Airbnb, Cisco, eBay, Netflix, Paypal, and Yahoo. In this course we explore some of the limitations of data warehouse solutions and discuss how Druid can compliment those technologies to form a flexible and scalable streaming analytics stack. We walk through many examples, offering participants the chance to implement and test Druid-based solutions in a lab environment. Audience     Application developers     Software engineers     Technical consultants     DevOps professionals     Architecture engineers Format of the course     Part lecture, part discussion, heavy hands-on practice, occasional tests to gauge understanding Introduction Installing and starting Druid Druid architecture and design Real-time ingestion of event data Sharding and indexing Loading data Querying data Visualizing data Running a distributed cluster Druid + Apache Hive Druid + Apache Kafka Druid + others Troubleshooting Administrative tasks
MLFWR1 Fundamentos de Aprendizaje Automático con R 14 horas El objetivo de este curso es proporcionar una competencia básica en la aplicación de los métodos de aprendizaje automático en la práctica. A través del uso de la plataforma de programación R y sus diversas bibliotecas, y basado en una multitud de ejemplos prácticos, este curso enseña cómo usar los bloques de construcción más importantes de Aprendizaje de Máquinas, cómo tomar decisiones de modelado de datos, interpretar los resultados de los algoritmos y Validar los resultados. Nuestro objetivo es darle las habilidades para entender y usar las herramientas más fundamentales de la caja de herramientas de Aprendizaje de Máquinas con confianza y evitar las trampas comunes de las aplicaciones de Data Sciences. Introducción al Aprendizaje de la Máquina Aplicada Aprendizaje estadístico vs. aprendizaje automático Iteración y evaluación Compensación entre sesgo y variación Regresión Regresión lineal Generalizaciones y no linealidad Clasificación Actualización bayesiana Naive Bayes Regresión logística K-Vecinos más cercanos Ejercicios Validación cruzada y re-muestreo Enfoques de validación cruzada Oreja Ejercicios Aprendizaje sin supervisión K-significa agrupación Ejemplos Desafíos del aprendizaje sin supervisión y más allá de K-means Precios Etiquetas: Prima
rprogda Programación R para el Análisis de Datos 14 horas Este curso es parte del conjunto de habilidades de Data Scientist (Dominio: Datos y Tecnología) Introducción y preliminares Haciendo R más amigable, R y GUIs disponibles Rstudio Software y documentación relacionados R y estadísticas Uso R interactivamente Una sesión introductoria Obtención de ayuda con funciones y funciones R, sensibilidad de mayúsculas y minúsculas, etc. Recuperación y corrección de comandos anteriores Ejecutar comandos o desviar la salida a un archivo Permanencia de datos y eliminación de objetos Manipulaciones sencillas; números y vectores Vectores y asignación Aritmética vectorial Generación de secuencias regulares Vectores lógicos Valores faltantes Vectores de caracteres Vectores de índice; seleccionar y modificar subconjuntos de un conjunto de datos Otros tipos de objetos Objetos, sus modos y atributos Atributos intrínsecos: modo y longitud Cambiar la longitud de un objeto Obtención y configuración de atributos La clase de un objeto Matrices y matrices Matrices Indexación de matrices. Subsecciones de una matriz Matrices de índice La función array () El producto externo de dos matrices Transposición generalizada de una matriz Instalaciones Matrix Multiplicación de matrices Ecuaciones lineales e inversión Valores propios y vectores propios Descomposición y determinantes del valor singular Ajuste de mínimos cuadrados y descomposición QR Formando matrices particionadas, cbind () y rbind () La función de concatenación, (), con arrays Tablas de frecuencia de los factores Listas y marcos de datos Liza Construir y modificar listas Concatenar listas Marcos de datos Creación de marcos de datos attach () y detach () Trabajar con marcos de datos Adjuntar listas arbitrarias Gestión de la ruta de búsqueda Manipulación de datos Selección, subconjunto de observaciones y variables Filtrado, agrupación Recodificación, transformaciones Agregación, combinación de conjuntos de datos Manipulación de caracteres, paquete stringr Lectura de datos Archivos Txt Archivos CSV XLS, XLSX archivos SPSS, SAS, Stata, ... y otros formatos de datos Exportar datos a txt, csv y otros formatos Acceso a datos desde bases de datos utilizando lenguaje SQL Distribuciones de probabilidad R como un conjunto de cuadros estadísticos Examinar la distribución de un conjunto de datos Pruebas de una y dos muestras Agrupación, bucles y ejecución condicional Expresiones agrupadas Declaraciones de control Ejecución condicional: si declaraciones La ejecución repetitiva: para los bucles, repetición y mientras Escribir sus propias funciones Ejemplos sencillos Definición de nuevos operadores binarios Argumentos y valores predeterminados El argumento Asignaciones dentro de las funciones Ejemplos más avanzados Factores de eficiencia en los diseños de bloques Eliminar todos los nombres de un conjunto impreso Integración numérica recursiva Alcance Personalización del entorno Clases, funciones genéricas y orientación a objetos Procedimientos gráficos Comandos de trazado de alto nivel La función plot () Visualización de datos multivariados Mostrar gráficos Argumentos a las funciones de trazado de alto nivel Gráficos de visualización básicos Relaciones multivariantes con el paquete de celosía y ggplot Uso de parámetros gráficos Lista de parámetros gráficos Informes automatizados e interactivos Combinación de salida de R con texto  
mtstatda Minitab para el Análisis Estadístico de Datos 14 horas El curso está dirigido a cualquier persona interesada en el análisis estadístico. Proporciona familiaridad con Minitab y aumentará la eficacia y eficiencia de su análisis de datos y mejorará su conocimiento de estadísticas Capítulo 1: Estadísticas Descriptivas y Análisis Gráfico 1.1 Introducción 1.1.1 Objetivos de aprendizaje 1.2 Tipos de datos 1.2.1 Conceptos Básicos 1.2.2 Tipos de datos 1.2.3 Prueba: Tipos de datos 1.3 Uso de Gráficos para Analizar Datos 1.3.1 Conceptos básicos 1.3.2 Gráficos de barras y diagramas de Pareto 1.3.3 Gráficos de Pie 1.3.4 Histogramas 1.3.5 Dotplots 1.3.6 Gráficos de valor individual 1.3.7 Boxplots 1.3.8 Parcelas de series temporales 1.3.9 Cuestionario: Uso de gráficos para analizar datos 1.3.10 Herramientas de Minitab: Gráfico de barras 1.3.11 Herramientas Minitab: Gráfico circular 1.3.12 Herramientas de Minitab: Histograma 1.3.13 Herramientas Minitab: Dotplot 1.3.14 Herramientas de Minitab: Trazo de valor individual 1.3.15 Herramientas Minitab: Boxplot 1.3.16 Herramientas de Minitab: Ploteo de series de tiempo 1.3.17 Ejercicio: Análisis Gráfico 1.4 Uso de Estadísticas para Analizar Datos 1.4.1 Conceptos básicos 1.4.2 Media y mediana 1.4.3 Rango, desviación y desviación estándar 1.4.4 Cuestionario: Uso de estadísticas para analizar datos 1.4.5 Herramientas de Minitab: mostrar estadísticas descriptivas 1.4.6 Ejercicio: Estadísticas Descriptivas 1.5 Summary 1.5.1 Revisión de los objetivos Capítulo 2: Inferencia Estadística 2.1 Introducción 2.1.1 Objetivos de aprendizaje 2.2 Fundamentos de la Inferencia Estadística 2.2.1 Conceptos básicos 2.2.2 Muestras aleatorias 2.2.3 Cuestionario: Fundamentos de la Inferencia Estadística 2.2.4 Herramientas de Minitab: Muestreo aleatorio 2.3 Distribuciones de Muestreo 2.3.1 Conceptos básicos 2.3.2 Distribución por muestreo de la media 2.3.3 Cuestionario: Distribuciones de muestreo 2.4 Distribución Normal 2.4.1 Conceptos básicos 2.4.2 Probabilidades asociadas a una distribución normal 2.4.3 Probabilidades asociadas con la media de la muestra 2.4.4 Cuestionario: Distribución normal 2.4.5 Herramientas Minitab: Probabilidades acumulativas con una distribución normal 2.4.6 Ejercicio: Probabilidades y Distribuciones Normales 2.5 Resumen 2.5.1 Revisión de los Objetivos Capítulo 3: Pruebas de Hipótesis y Intervalos de Confianza 3.1 Introducción 3.1.1 Objetivos de aprendizaje 3.2 Pruebas y Intervalos de Confianza 3.2.1 Intervalos de Confianza 3.2.2 Pruebas de hipótesis 3.2.3 Uso de pruebas de hipótesis para tomar decisiones 3.2.4 Errores de Tipo I y Tipo II y Potencia 3.2.5 Prueba: Pruebas y intervalos de confianza 3.3 Prueba t de 1 Muestra 3.3.1 Conceptos básicos 3.3.2 Gráficos de valor individual 3.3.3 Resultados de la prueba t de 1 muestra 3.3.4 Supuestos 3.3.5 Cuestionario: Prueba t de 1 muestra 3.3.6 Herramientas de Minitab: Prueba t de 1 muestra 3.3.7 Ejercicio: Prueba t de 1 muestra 3.4 2 Ensayo de Variancias 3.4.1 Conceptos básicos 3.4.2 Lotes de caja 3.4.3 2 Pruebas Resultados de la prueba 3.4.4 Suposiciones 3.4.5 Prueba: Prueba de 2 varianzas 3.4.6 Herramientas Minitab: Prueba de 2 varianzas 3.4.7 Ejercicio: Prueba de 2 varianzas 3.5 Prueba t de 2 Muestras 3.5.1 Conceptos básicos 3.5.2 Trazado de valor individual 3.5.3 Resultados de la prueba t de 2 muestras 3.5.4 Supuestos 3.5.5 Cuestionario: Prueba t de 2 muestras 3.5.6 Herramientas Minitab: Prueba t de 2 muestras 3.5.7 Ejercicio: Prueba t de 2 muestras 3.6 Prueba t Pareada 3.6.1 Conceptos básicos 3.6.2 Gráficos de valores individuales 3.6.3 Resultados de las pruebas t pareadas 3.6.4 Supuestos 3.6.5 Prueba: Prueba t pareada 3.6.6 Herramientas Minitab: Prueba t pareada 3.6.7 Ejercicio: Prueba t pareada 3.7 1 Prueba de Proporción 3.7.1 Conceptos básicos 3.7.2 1 Resultados de la prueba de proporción 3.7.3 Supuestos 3.7.4 Cuestionario: Prueba de 1 Proporción 3.7.5 Herramientas de Minitab: Prueba de 1 Proporción 3.7.6 Ejercicio: Prueba de 1 Proporción 3.8 Prueba de 2 Proporciones 3.8.1 Conceptos básicos 3.8.2 2 Proporciones Resultados de las pruebas 3.8.3 Supuestos 3.8.4 Prueba: Prueba de 2 Proporciones 3.8.5 Herramientas de Minitab: Prueba de 2 Proporciones 3.8.6 Ejercicio: Prueba de 2 Proporciones 3.9 Prueba Chi-Cuadrada 3.9.1 Conceptos básicos 3.9.2 Resultados de la prueba Chi-Square 3.9.3 Supuestos 3.9.4 Cuestionario: Prueba de Chi cuadrado 3.9.5 Herramientas Minitab: Prueba Chi-Square 3.9.6 Ejercicio: Prueba Chi-Cuadrada 3.10 Resumen 3.10.1 Revisión de los objetivos Capítulo 4: Cuadros de Control 4.1 Introducción 4.1.1 Objetivos de aprendizaje 4.2 Control Estadístico de Procesos 4.2.1 Conceptos básicos 4.2.2 Patrones en gráficos de control 4.2.3 Prueba: Control Estadístico de Procesos 4.3 Cuadros de Control para Datos de Variables en Subgrupos 4.3.1 Conceptos básicos 4.3.2 Gráficos R 4.3.3 Cuadros S 4.3.4 Gráficos Xbar 4.3.5 Cuestionario: Diagramas de control para datos de variables en subgrupos 4.3.6 Herramientas Minitab: Gráfico Xbar-R 4.3.7 Ejercicio: Gráfico Xbar-R 4.4 Cuadros de Control para Observaciones Individuales 4.4.1 Conceptos básicos 4.4.2 Gráficos de rango de movimiento 4.4.3 Cuadros individuales 4.4.4 Cuestionario: Cuadros de control para observaciones individuales 4.4.5 Herramientas de Minitab: Tabla I-MR 4.4.6 Ejercicio: Tabla I-MR 4.5 Cuadros de Control para Datos de Atributos 4.5.1 Conceptos básicos 4.5.2 Gráficos NP y P 4.5.3 Gráficos C y U 4.5.4 Cuestionario: Cuadros de control para los datos de los atributos 4.5.5 Herramientas Minitab: Gráfico P 4.5.6 Ejercicio: Gráfico P 4.6 Resumen 4.6.1 Revisión de los objetivos Capítulo 5: Capacidad del Proceso 5.1 Introducción 5.1.1 Objetivos de aprendizaje 5.2 Capacidad del Proceso para Datos Normales 5.2.1 Conceptos básicos 5.2.2 Supuestos 5.2.3 Prueba de la normalidad 5.2.4 Cuestionario: capacidad del proceso para datos normales 5.2.5 Herramientas Minitab: Prueba de Normalidad 5.2.6 Ejercicio: supuestos para la capacidad del proceso 5.3 Índices de Capacidad 5.3.1 Capacidad potencial: Cp y Cpk 5.3.2 Rendimiento del proceso: Pp y Ppk 5.3.3 Nivel Sigma 5.3.4 Cuestionario: Índices de Capacidad 5.3.5 Herramientas de Minitab: Cp y Pp 5.3.6 Herramientas Minitab: Nivel Sigma 5.3.7 Ejercicio: capacidad del proceso para datos normales 5.4 Capacidad del Proceso para Datos no Normales 5.4.1 Transformaciones y Distribuciones Alternativas 5.4.2 Transformación de Box-Cox 5.4.3 Transformación de Johnson 5.4.4 Distribuciones alternativas 5.4.5 Cuestionario: capacidad del proceso para datos no normales 5.4.6 Herramientas de Minitab: Transformación de Box-Cox 5.4.7 Herramientas de Minitab: Johnson Transformation 5.4.8 Herramientas de Minitab: Análisis de Capacidad con Johnson Transformation 5.4.9 Herramientas Minitab: Distribuciones alternativas 5.4.10 Herramientas Minitab: Análisis de Capacidad con Distribuciones Alternativas 5.4.11 Ejercicio: Capacidad de proceso con transformaciones de datos 5.4.12 Ejercicio: Capacidad del proceso con distribuciones alternativas 5.5 Resumen 5.5.1 Revisión de los objetivos Capítulo 6: Análisis de la Varianza (ANOVA) 6.1 Introducción 6.1.1 Objetivos de aprendizaje 6.2 Fundamentos de ANOVA 6.2.1 Conceptos básicos 6.2.2 Gráficos y Estadísticas resumidas 6.2.3 Cuestionario: Fundamentos de ANOVA 6.3 ANOVA Unidireccional 6.3.1 Hypothesis Tests 6.3.2 F-Statistics and P-Values 6.3.3 Multiple Comparisons 6.3.4 Assumptions and Residual Plots 6.3.5 Quiz: One-Way ANOVA 6.3.6 Minitab Tools: One-Way ANOVA 6.3.7 Exercise: One-Way ANOVA 6.4 ANOVA de dos Vías 6.4.1 Conceptos básicos 6.4.2 Gráficos 6.4.3 Pruebas de hipótesis 6.4.4 Estadísticas F y Valores P 6.4.5 Supuestos y parcelas residuales 6.4.6 Cuestionario: ANOVA de dos vías 6.4.7 Herramientas de Minitab: ANOVA bidireccional 6.4.8 Ejercicio: ANOVA bidireccional 6.5 Resumen 6.5.1 Resumen del ANOVA Capítulo 7: Correlación y Regresión 7.1 Introducción 7.1.1 Objetivos de aprendizaje 7.2 Relación entre dos Variables Cuantitativas 7.2.1 Conceptos básicos 7.2.2 Diagrama de dispersión 7.2.3 Correlación 7.2.4 Prueba: Relación entre dos variables cuantitativas 7.2.5 Herramientas Minitab: Scatterplot 7.2.6 Herramientas de Minitab: Correlación 7.2.7 Ejercicio: diagramas de dispersión y correlación 7.3 Regresión Simple 7.3.1 Conceptos básicos 7.3.2 Regresión 7.3.3 Pruebas de hipótesis y R2 7.3.4 Supuestos y parcelas residuales 7.3.5 Prueba: Regresión simple 7.3.6 Herramientas de Minitab: Simple Regression 7.3.7 Ejercicio: Regresión Simple 7.4 Resumen 7.4.1 Revisión de los Objetivos Capítulo 8: Análisis de Sistemas de Medición 8.1 Introducción 8.1.1 Objetivos de aprendizaje 8.2 Fundamentos del Análisis de Sistemas de Medición 8.2.1 Conceptos básicos 8.2.2 Precisión 8.2.3 Precisión 8.2.4 Comparación de precisión y precisión 8.2.5 Cuestionario: Fundamentos del Análisis de Sistemas de Medición 8.3 Repetibilidad y Reproducibilidad 8.3.1 Conceptos básicos 8.3.2 Estudios de R & R de Gage 8.3.3 Prueba: Repetibilidad y Reproducibilidad 8.4 Análisis Gráfico de un Estudio de R & R de Gage 8.4.1 Conceptos básicos 8.4.2 Componentes de la variación 8.4.3 Gráficos Xbar y R 8.4.4 Interacción entre el operador y la parte 8.4.5 Parcelas comparativas 8.4.6 Gráficos de Gage Run 8.4.7 Cuestionario: Análisis Gráfico de un Estudio de R & R de Gage 8.4.8 Herramientas de Minitab: Estudio de R & R de Gage Cruzado 8.4.9 Herramientas de Minitab: Gráfico de ejecución de calibración 8.4.10 Ejercicio: Análisis Gráfico de un Estudio de R & R de Gage 8.5 Variación 8.5.1 Desviación estándar y variación del estudio 8.5.2 Tolerancia 8.5.3 Variación del proceso 8.5.4 Cuestionario: Variación 8.5.5 Ejercicio: Análisis Numérico de un Estudio de R & R de Gage 8.6 ANOVA con un Estudio de Gage R & R 8.6.1 Componentes de la varianza 8.6.2 Análisis de las Tablas de Varianza 8.6.3 Prueba: ANOVA con un estudio de R & R de Gage 8.6.4 Ejercicio: Resultados de ANOVA para un estudio de R & R de calibración 8.7 Estudios de Linealidad y Sesgo 8.7.1 Conceptos básicos 8.7.2 Linealidad del medidor 8.7.3 Diagrama de la medición 8.7.4 Cuestionario: Linearidad de Gage y Estudio de Sesgo 8.7.5 Herramientas de Minitab: Linearidad de Gage y Estudio de Sesgo 8.7.6 Ejercicio: Estudio de linealidad y sesgo de Gage 8.8 Análisis de Acuerdo de Atributo 8.8.1 Conceptos básicos 8.8.2 Datos binarios 8.8.3 Datos nominales 8.8.4 Datos ordinales 8.8.5 Cuestionario: Análisis de acuerdo de atributo 8.8.6 Herramientas de Minitab: Análisis de acuerdo de atributo con datos binarios 8.8.7 Herramientas de Minitab: Análisis de acuerdo de atributo con datos nominales 8.8.8 Herramientas de Minitab: Análisis de acuerdo de atributo con datos ordinales 8.8.9 Ejercicio: Análisis de acuerdo de atributo 8.9 Resumen 8.9.1 Revisión de objetivos Capítulo 9: Diseño de experimentos 9.1 Introducción 9.1.1 Objetivos de Aprendizaje 9.2 Diseños Factoriales 9.2.1 Conceptos básicos 9.2.2 Creación de diseños factóricos completos 9.2.3 Análisis de diseños factóricos completos 9.2.4 Cuestionario: Diseños Factoriales 9.2.5 Herramientas de Minitab: Creación de un diseño factorial completo 9.2.6 Herramientas de Minitab: Analizar un diseño factorial completo 9.2.7 Ejercicio: Crear un diseño factorial completo 9.2.8 Ejercicio: Analizar un diseño factorial completo 9.3 Bloqueo e Incorporación de untos Centrales 9.3.1 Bloqueo 9.3.2 Puntos Centrales 9.3.3 Análisis de diseños con bloques y puntos centrales 9.3.4 Cuestionario: Bloqueo e incorporación de puntos centrales 9.3.5 Herramientas de Minitab: Creación de un diseño factorial con bloques y puntos centrales 9.3.6 Herramientas Minitab: Analizar un diseño factorial con bloques y puntos centrales 9.3.7 Ejercicio: Crear un diseño factorial con bloques y puntos centrales 9.3.8 Ejercicio: Analizar un diseño factorial con bloques y puntos centrales 9.4 Diseños Factoriales Fraccionarios 9.4.1 Conceptos básicos 9.4.2 Creación de diseños factoriales fraccionales 9.4.3 Análisis de diseños factoriales fraccionales 9.4.4 Cuestionario: Diseños Factoriales Fraccionales 9.4.5 Herramientas Minitab: Creación de un diseño factorial fraccional 9.4.6 Herramientas de Minitab: Analizar un diseño factorial fraccional 9.5 Optimización de la Respuesta 9.5.1 Optimización de la respuesta 9.5.2 Cuestionario: Optimización de la respuesta 9.5.3 Herramientas de Minitab: Optimización de respuestas 9.5.4 Ejercicio: Optimización de la respue 9.6 Resumen 9.6.1 Revisión de los objetivos
mlentre Aprendizaje Automático Aplicado 21 horas This training course is for people that would like to apply Machine Learning in practical applications for their team.  The training will not dive into technicalities and revolve around basic concepts and business/operational applications of the same. Target Audience Investors and AI entrepreneurs Managers and Engineers whose company is venturing into AI space Business Analysts & Investors Introduction to Neural Networks Introduction to Applied Machine Learning Statistical learning vs. Machine learning Iteration and evaluation Bias-Variance trade-off Machine Learning with Python Choice of libraries Add-on tools Machine learning Concepts and Applications Regression Linear regression Generalizations and Nonlinearity Use cases Classification Bayesian refresher Naive Bayes Logistic regression K-Nearest neighbors Use Cases Cross-validation and Resampling Cross-validation approaches Bootstrap Use Cases Unsupervised Learning K-means clustering Examples Challenges of unsupervised learning and beyond K-means Short Introduction to NLP methods word and sentence tokenization text classification sentiment analysis spelling correction information extraction parsing meaning extraction question answering Artificial Intelligence & Deep Learning Technical Overview R v/s Python Caffe v/s Tensor Flow Various Machine Learning Libraries
octaveda Octave para el Análisis de Datos 14 horas Audiencia: Este curso es para científicos de datos y estadísticos que tienen algunos métodos estadísticos de familiaridad y le gustaría usar el lenguaje de programación de Octave en el trabajo. El propósito de este curso es dar una introducción práctica en la programación de Octave a los participantes interesados en usar este lenguaje de programación en el trabajo. Ambiente Tipos de datos: Numérico Cadena, arrays Matrices Variables Expresiones Flujo de control Funciones Manejo de excepciones Depuración De entrada y salida Àlgebra lineal Mejoramiento Distribuciones estadísticas Regresión Trazado
dmmlr Minería de Datos y Aprendizaje Automático con R 14 horas Introducción a la minería de datos y el aprendizaje automático Aprendizaje estadístico vs. aprendizaje automático Iteración y evaluación Compensación entre sesgo y variación Regresión Regresión lineal Generalizaciones y no linealidad Ceremonias Clasificación Actualización bayesiana Naive Bayes Dicriminant analysis Regresión logística K-Vecinos más cercanos Soporte de máquinas vectoriales Redes neuronales Árboles de decisión Ceremonias Validación cruzada y re-muestreo Enfoques de validación cruzada Oreja Ceremonias Aprendizaje sin supervisión K-significa agrupación Ejemplos Desafíos del aprendizaje sin supervisión y más allá de K-means Temas avanzados Modelos de Ensemble Modelos mixtos Aumento Ejemplos Reducción multidimensional Análisis factorial Análisis de componentes principales Ejemplos
excelafd Analysing Financial Data in Excel 14 horas Audience Financial or market analysts, managers, accountants Course Objectives Facilitate and automate all kinds of financial analysis with Microsoft Excel Advanced functions Logical functions Math and statistical functions Financial functions Lookups and data tables Using lookup functions Using MATCH and INDEX Advanced list management Validating cell entries Exploring database functions PivotTables and PivotCharts Creating Pivot Tables Calculated Item and Calculated Field Working with External Data Exporting and importing Exporting and importing XML data Querying external databases Linking to a database Linking to a XML data source Analysing online data (Web Queries) Analytical options Goal Seek Solver The Analysis ToolPack Scenarios Macros and custom functions Running and recording a macro Working with VBA code Creating functions Conditional formatting and SmartArt Conditional formatting with graphics SmartArt graphics
sixsigmagb Six Sigma Green Belt 70 horas Green Belts participa y dirige proyectos Lean y Six Sigma dentro de su función de trabajo regular. Pueden abordar proyectos como parte de un equipo transversal o proyectos con alcance dentro de su trabajo normal. Cada sesión de entrenamiento Green Belt se separa por 3 ó 4 semanas cuando los Green Belts aplican su entrenamiento a sus proyectos de mejora. Recomendamos apoyar a los Green Belts en sus proyectos entre las sesiones de entrenamiento y la celebración de revisiones de la puerta de la etapa junto con el liderazgo y Lean Six Sigma Champions para asegurar que la metodología DMAIC se está aplicando rigurosamente. Fundación de la Semana 1: cubre los fundamentos del enfoque Lean Six Sigma Definir Medir Analizar Mejorar el Control (DMAIC) que permite a los participantes participar y dirigir proyectos e iniciativas de reducción de desperdicios y defectos. Practicante de la semana 2: Proporciona análisis de datos adicionales y herramientas magras para que los participantes lideren proyectos de mejora de procesos bien definidos relacionados con su función de trabajo regular. Bloque 1 Día 1 Introducción a Six Sigma Proyecto Chartering & VOC Mapeo de procesos Analisis de los interesados Dia 2 Inicio del equipo Matriz de priorización Pensamiento Lean Mapeo de la cadena de valor Día 3 Recopilación de datos Minitab y Análisis Gráfico Estadísticas descriptivas Día 4 Evaluación del Sistema de Medición Capacidad del proceso Cp, CpK Métricas Seis Sigma Día 5 5 Why FMEA Block 2 Día 1 Revisión del bloque 1 Multivari Estadística inferencial Introducción a la Prueba de Hipótesis Dia 2 2 pruebas t de muestra Pruebas F Pruebas de Hipótesis - Chi Sq Día 3 Pruebas de hipótesis - Anova Día 4 Correlación y regresión Regresión múltiple Introducción al diseño de experimentos Día 5 Prueba de errores Planes de Control Gráficos de control
statsqa Análisis Estadístico de la Calidad 7 horas Este curso cubre los fundamentos del control estadístico de procesos y cómo estas herramientas de calidad pueden proporcionar la evidencia necesaria para mejorar y controlar los procesos. Conozca cuándo y dónde usar los diferentes tipos de gráficos de control disponibles en Minitab para sus propios procesos. Y aprenda a utilizar herramientas de análisis de capacidades para evaluar sus procesos. Gage R & R, Pruebas destructivas, Gage Linealidad y sesgo, Acuerdo de atributo, Variables y gráficos de control de atributos, Análisis de capacidad para datos normales, no normales y de atributo
predmodr Análisis Predictivo con R 14 horas Problemas con los pronosticadores Planificación de la demanda del cliente Incertidumbre del inversor Planificación económica Cambios estacionales en la demanda / utilización Roles de riesgo e incertidumbre Series de tiempo Ajuste estacional Media móvil Suavizado exponencial Extrapolación Predicción lineal Estimación de tendencias Estacionariedad y modelado ARIMA Métodos econométricos (métodos casuales) Análisis de regresión Regresión lineal múltiple Regresión no lineal múltiple Validación de regresión Pronóstico de la regresión Métodos de juicio Encuestas Método Delphi Construcción de escenarios Previsión tecnológica Pronóstico por analogía Simulación y otros métodos Simulación Mercado de predicción Pronóstico probabilístico y predicción Ensemble
mrkfct Pronóstico de Mercado 14 horas Audiencia Este curso ha sido creado para analistas, pronosticadores que desean introducir o mejorar pronósticos que pueden estar relacionados con la predicción de ventas, previsión económica, previsión tecnológica, gestión de la cadena de suministro y previsión de demanda o oferta. Descripción Este curso guía a los delegados a través de una serie de metodologías, marcos y algoritmos que son útiles para elegir cómo predecir el futuro basados en datos históricos. Utiliza herramientas estándar como Microsoft Excel o algunos programas Open Source (especialmente el proyecto R). Los principios cubiertos en este curso pueden ser implementados por cualquier software (por ejemplo, SAS, SPSS, Statistica, MINITAB ...)   Problemas con los Pronosticadores Planificación de la demanda del cliente Incertidumbre del inversor Planificación económica Cambios estacionales en la demanda / utilización Roles de riesgo e incertidumbre Métodos de Series de Tiempo Media móvil Suavizado exponencial Extrapolación Predicción lineal Estimación de tendencias Curva de crecimiento Métodos Econométricos (métodos casuales) Análisis de regresión mediante regresión lineal o regresión no lineal El promedio móvil autorregressivo (ARMA) Promedio móvil integrado (ARIMA) Econometría Métodos de Juicio Encuestas Método Delphi Construcción de escenarios Previsión tecnológica Pronóstico por analogía Simulación y otros Métodos Simulación Mercado de predicción Predicción probabilística y predicción Ensemble Pronóstico de clases de referencia
advspsspas Estadísticas Avanzadas Utilizando el Software de Análisis Predictivo de SPSS 28 horas Gol: Dominar el trabajo de habilidad de forma independiente con el programa SPSS para uso avanzado, cuadros de diálogo y sintaxis del lenguaje de comandos para las técnicas analíticas seleccionadas. Los destinatarios: Analistas, investigadores, científicos, estudiantes y todos aquellos que quieran adquirir la capacidad de utilizar el paquete SPSS y el nivel avanzado y aprender los modelos estadísticos seleccionados. Formación toma problemas de análisis universal y se dedica a una industria específica     Preparación de una base de datos para su análisis Gestión de la recolección de datos Operaciones sobre variables Transformando las variables funciones seleccionadas (logarítmicas, exponenciales, etc.) Estadísticas paramétricas y no paramétricas, o cómo ajustar un modelo a los datos Escala de medición Tipo de distribución Valores atípicos y observaciones influyentes (valores atípicos) tamaño de la muestra teorema del límite central Estudiar las diferencias entre las características de las estadísticas Pruebas basadas en el promedio y los medios Análisis de correlaciones y similitudes Correlaciones análisis de componentes principales análisis de conglomerados Predicción - análisis de regresión simple y multivariable Método de mínimos cuadrados Modelo lineal Modelos de regresión de variables instrumentales (ficticio, efecto, codificación ortogonal) Inferencia estadística
datacolmtd Métodos de Recolección de Datos 14 horas Método de recogida de datos Diseño de encuestas (incluyendo cuestionario y diseño de preguntas) Diferentes tipos de encuestas (secciones transversales / series temporales / panel) Sesgo de medición Sesgo de encuadre Sesgo de respuesta Análisis de no respuesta Métodos utilizados para ayudar a corregir el sesgo (por ejemplo, ponderación) Enlace de datos (por ejemplo, vinculación de datos de la encuesta con datos administrativos) Evaluación de la calidad de los datos y validación de datos
tableauvra Informes Visuales y Análisis con Tableau 7 horas Conexión a los datos Conexión a varias bases de datos - tipos de conexión de datos Múltiples fuentes de datos y mezcla de datos Creación de visualizaciones básicas Clasificación, Filtrado, Organización de datos Uso de múltiples medidas en el mismo eje Mostrar la relación entre los valores numéricos Mapeo de datos geográficamente Geocodificación de Tableau - mapeo avanzado + uso de imágenes de fondo Cálculos básicos y agregaciones Parámetros, líneas de referencia Visión general de visualizaciones adicionales Dashboards: filtros rápidos, acciones y parámetros Cálculos avanzados Consejos y trucos - parámetros, cálculos, clasificación, filtrado, etc. Prácticas recomendadas al utilizar Tableau
statsres Estadística para Investigadores 35 horas Este curso tiene como objetivo dar a los investigadores una comprensión de los principios de diseño estadístico y análisis y su relevancia para la investigación en una gama de disciplinas científicas. Cubre algunos métodos probabilísticos y estadísticos, principalmente a través de ejemplos. Esta formación contiene alrededor del 30% de las conferencias, el 70% de las pruebas guiadas y los laboratorios. En el caso de curso cerrado podemos adaptar los ejemplos y materiales a una rama específica (como pruebas de psicología, sector público, biología, genética, etc ...) En el caso de cursos públicos, se utilizan ejemplos mixtos. Aunque varios programas se utilizan durante este curso (Microsoft Excel a SPSS, Statgraphics, etc ...), su enfoque principal es la comprensión de los principios y procesos que guían la investigación, el razonamiento y la conclusión. Este curso puede ser impartido como un curso combinado, es decir, con tareas y asignaciones. Método Científico, Probabilidad y Estadística Muy corta historia de estadísticas Por qué puede estar "seguro" de las conclusiones Probabilidad y toma de decisiones Preparación para la Investigación (decidir "qué" y "cómo") El panorama general: la investigación es parte de un proceso con entradas y salidas Reuniendo datos Interrogadores y medición Qué medir Estudios observacionales Diseño de experimentos Análisis de Datos y Métodos Gráficos Habilidades y técnicas de investigación Gestión de la Investigación Describiendo Datos Bivariados Introducción a los datos bivariados Valores de la correlación de Pearson Adivinar la simulación de correlaciones Propiedades de la r de Pearson Computación de Pearson Restricción de la demostración de rango Ley de suma de desviación II Ceremonias Probabilidad Introducción Conceptos básicos Demostración Probabilidad Condicional Gamblers Fallacy Simulation Demostración de Cumpleaños Distribución binomial Demostración Binomial Tarifas base Demostración del Teorema de Bayes Demostración del problema de Monty Hall Ceremonias Distribuciones Normales Introducción Historia Áreas de distribución normal Variedades de Demostración de Distribución Normal Estándar Normal Aproximación Normal al Binomio Demostración de aproximación normal Ceremonias Distribuciones de Muestreo Introducción Demostración básica Demostración del tamaño de la muestra Demostración del teorema del límite central Distribución de muestreo de la media Distribución de muestreo de la diferencia entre los medios Distribución de muestreo de r de Pearson Distribución de muestreo de una proporción Ceremonias Estimacion Introducción Grados de libertad Características de los estimadores Simulación de polarización y variabilidad Intervalos de confianza Ceremonias Lógica de la Prueba de Hipótesis Introducción Pruebas de Significancia Errores de Tipo I y Tipo II Pruebas de una y dos colas Interpretación de Resultados Significativos Interpretación de resultados no significativos Pasos en la prueba de hipótesis Pruebas de significación y intervalos de confianza Conceptos erróneos Ceremonias Medios de Prueba Media simple T Demostración de distribución Diferencia entre dos medios (grupos independientes) Simulación de robustez Todas las comparaciones de pares entre medios Comparaciones Específicas Diferencia entre dos medios (pares correlacionados) Simulación correlacionada t Comparaciones Específicas (Observaciones Correlacionadas) Comparaciones de parejas (Observaciones correlacionadas) Ceremonias Poder Introducción Cálculos de ejemplo Factores que afectan el poder Ceremonias Predicción Introducción a la regresión lineal simple Demostración Linear Fit Partición de sumas de cuadrados Error estándar de la estimación Demostración de línea de predicción Estadísticas inferenciales para b y r Ceremonias ANOVA Introducción Diseños de ANOVA ANOVA de un factor (entre sujetos) Demostración unidireccional ANOVA Multi-Factor (Entre Sujetos) Tamaños de muestra desiguales Ensayos que complementan ANOVA ANOVA dentro de los sujetos Power of Within-Subjects Diseños Demo Ceremonias Plaza Chi Distribución Chi Square Tablas unidireccionales Prueba de distribuciones Demo Tablas de contingencia Simulación de mesa 2 x 2 Ceremonias Estudios de Caso Análisis de estudios de casos seleccionados
nlpwithr Natural Language Processing (NLP) with R 21 horas Se estima que los datos no estructurados representan más del 90 por ciento de todos los datos, gran parte de ellos en forma de texto. Las publicaciones del blog, los tweets, los medios sociales y otras publicaciones digitales añaden continuamente a este creciente cuerpo de datos. Este curso se centra en la extracción de información y significado de estos datos. Utilizando las bibliotecas de lenguaje y procesamiento de lenguaje natural (NLP), combinamos conceptos y técnicas de la informática, la inteligencia artificial y la lingüística computacional para entender algorítmicamente el significado detrás de los datos de texto. Las muestras de datos están disponibles en varios idiomas según los requisitos del cliente. Al final de este entrenamiento los participantes serán capaces de preparar conjuntos de datos (grandes y pequeños) de fuentes dispares, a continuación, aplicar los algoritmos adecuados para analizar e informar sobre su significado. Audiencia Lingüistas y programadores Formato del curso Parte conferencia, discusión de la parte, práctica práctica pesada, pruebas ocasionales para calibrar la comprensión Introducciòn PNL y R vs Python Instalación y configuración de R Studio Instalación de paquetes R relacionados con procesamiento de lenguaje natural (NLP). Una visión general de las capacidades de manipulación de textos de R Comenzar con un proyecto de PNL en R Lectura e importación de archivos de datos en R Manipulación de texto con R Agrupación de documentos en R Partes del etiquetado de voz en R El análisis de oraciones en R Trabajo con expresiones regulares en R Reconocimiento de entidades nombradas en R Tema de modelado en R Clasificación de texto en R Trabajar con conjuntos de datos muy grandes Visualización de los resultados Mejoramiento Integración de R con otros lenguajes (Java, Python, etc.) Comentarios de cierre
descstats Estadísticas Descriptivas 14 horas Este curso cubrirá los promedios (media, mediana, modo, proporciones, etc), dispersiones (varianza, desviación estándar, etc), tablas de contingencia (tablas cruzadas, etc), gráficos / gráficos Tipos de datos Distribuciones Tendencia central - media, mediana, modo Medidas de dispersión - varianza, desviación estándar Error estándar Teorema del límite central y ley de grandes números Intervalos de confianza, valores p Pruebas de hipótesis, significación estadística Covarianza y correlación Inferencia causal versus descriptiva Preferencia declarada versus preferencia revelada Elegir el tamaño exacto de la muestra ex ante Salida (tablas y gráficos)
spssanal Análisis Estadístico Mediante SPSS 21 horas Introducción a SPSS Obtención, edición y almacenamiento de datos Manipulación de datos Procedimientos de Estadística Descriptiva Evaluación de los supuestos de distribución de puntuaciones t Pruebas Diferencias de grupo univariadas: Anova y Ancova Grupo Multivariativo Dfferences: Manova Procedimientos no paramétricos para analizar los datos de seguridad Correlaciones Regresión con variables cuantitativas Regresión con variables categóricas Análisis de Componentes Principales y Análisis de Factores
StaEcoMod Modelado Estadístico y Econométrico 21 horas La Naturaleza de la Econometría y Datos Económicos Econometría y modelos Pasos en el modelado econométrico Tipos de datos económicos, series temporales, secciones transversales, panel Causalidad en el análisis econométrico Especificaciones y problemas de datos Forma funcional Variables proxy Error de medida en las variables Datos faltantes, valores atípicos, observaciones influyentes Análisis de regresión Estimacion Los estimadores de mínimos cuadrados ordinarios (MCO) Los supuestos OLS clásicos, Teorema de Markov de Gauss Los mejores estimadores lineales no implicados Inference Testing statistical significance of parameters t-test(single, group) Confidence intervals Testing multiple linear restrictions, F-test Goodness of fit Testing functional form Missing variables Binary variables Pruebas de violación de suposiciones y sus implicaciones: Heterocedasticidad Autocorrelación Multicolinealidad Endogeneidad Otras Técnicas de Estimación Estimación de variables instrumentales Mínimos cuadrados generalizados Máxima verosimilitud Método Generalizado de Momentos Modelos para variables de respuesta binaria Modelo de probabilidad lineal Modelo Probit Modelo Logit Estimacion Interpretación de parámetros, Efectos marginales Bondad de ajuste Variables dependientes limitadas Modelo Tobit Distribución normal truncada Interpretación del modelo Tobit Cuestiones de especificación y estimación Modelos de series temporales Características de las series temporales Decomposición de series temporales Suavizado Exponencial Estacionariedad Modelos ARIMA Co-Integración Modelo ECM Análisis Predictivo Pronóstico, planificación y metas Pasos en la previsión Evaluación de la precisión de los pronósticos Redisual Diagnostics Intervalos de predicción
intror Introducción a R con Análisis de Series Temporales 21 horas Introducción y preliminares Haciendo R más amigable, R y GUIs disponibles Rstudio Software y documentación relacionados R y estadísticas Uso R interactivamente Una sesión introductoria Obtención de ayuda con funciones y funciones R, sensibilidad de mayúsculas y minúsculas, etc. Recuperación y corrección de comandos anteriores Ejecutar comandos o desviar la salida a un archivo Permanencia de datos y eliminación de objetos Manipulaciones sencillas; números y vectores Vectores y asignación Aritmética vectorial Generación de secuencias regulares Vectores lógicos Valores faltantes Vectores de caracteres Vectores de índice; seleccionar y modificar subconjuntos de un conjunto de datos Otros tipos de objetos Objetos, sus modos y atributos Atributos intrínsecos: modo y longitud Cambiar la longitud de un objeto Obtención y configuración de atributos La clase de un objeto Matrices y matrices Matrices Indexación de matrices. Subsecciones de una matriz Matrices de índice La función array () El producto externo de dos matrices Transposición generalizada de una matriz Instalaciones Matrix Multiplicación de matrices Ecuaciones lineales e inversión Valores propios y vectores propios Descomposición y determinantes del valor singular Ajuste de mínimos cuadrados y descomposición QR Formando matrices particionadas, cbind () y rbind () La función de concatenación, (), con arrays Tablas de frecuencia de los factores k Listas y marcos de datos Liza Construir y modificar listas Concatenar listas Marcos de datos Creación de marcos de datos attach () y detach () Trabajar con marcos de datos Adjuntar listas arbitrarias Gestión de la ruta de búsqueda ​​​​​​​ Manipulación de datos Selección, subconjunto de observaciones y variables Filtrado, agrupación Recodificación, transformaciones Agregación, combinación de conjuntos de datos Manipulación de caracteres, paquete stringr Lectura de datos Archivos Txt Archivos CSV XLS, XLSX archivos SPSS, SAS, Stata, ... y otros formatos de datos Exportar datos a txt, csv y otros formatos Acceso a datos desde bases de datos utilizando lenguaje SQL Distribuciones de probabilidad R como un conjunto de cuadros estadísticos Examinar la distribución de un conjunto de datos Pruebas de una y dos muestras Agrupación, bucles y ejecución condicional Expresiones agrupadas Declaraciones de control Ejecución condicional: si declaraciones Ejecución repetitiva: para bucles, repetición y mientras Escribir sus propias funciones Ejemplos sencillos Definición de nuevos operadores binarios Argumentos y valores predeterminados El argumento Asignaciones dentro de las funciones Ejemplos más avanzados Factores de eficiencia en los diseños de bloques Eliminar todos los nombres de un conjunto impreso Integración numérica recursiva Alcance Personalización del entorno Clases, funciones genéricas y orientación a objetos Procedimientos gráficos Comandos de trazado de alto nivel La función plot () Visualización de datos multivariados Mostrar gráficos Argumentos a las funciones de trazado de alto nivel Gráficos de visualización básicos Relaciones multivariantes con el paquete de celosía y ggplot Uso de parámetros gráficos Lista de parámetros gráficos Series de tiempo Ajuste estacional Media móvil Suavizado exponencial Extrapolación Predicción lineal Estimación de tendencias Estacionariedad y modelado ARIMA Métodos econométricos (métodos casuales) Análisis de regresión Regresión lineal múltiple Regresión no lineal múltiple Validación de regresión Pronóstico de la regresión  
sixsigmayb Six Sigma Yellow Belt 21 horas Yellow Belt cubre los fundamentos del enfoque Six Sigma Define Measure Analyze Improve Control (DMAIC), que permite a los delegados participar y dirigir proyectos e iniciativas de reducción de defectos y desperdicios basados en equipos. Además se hace hincapié en la aplicación de las herramientas de resolución de problemas en las funciones diarias. Al final del curso estarás equipado para mirar a tu equipo y rol inmediato, determinar qué se puede mejorar y crear un proyecto de mejora de negocios en una oportunidad seleccionada que esté alineada con las necesidades del cliente. Podrá analizar el proceso utilizando herramientas de visualización e identificar los componentes de residuos (sin valor añadido) y trabajar para eliminarlos del proceso. Se aplicarán técnicas de análisis de causa raíz para identificar las causas subyacentes de los defectos en el proceso. El curso utiliza simulaciones, ejercicios de estudio de casos y proyectos basados en el trabajo para permitir a los delegados "aprender haciendo". Notas: Este curso tiene un tamaño mínimo de clase de 4. Y si se solicita este curso se puede entregar en 2 días con algunas reducciones en el contenido del curso y el nivel de detalle en algunas áreas, especialmente las necesidades del cliente; Análisis gráfico y transferencia de procesos. Una visión general de la selección de proyectos y del alcance Comprender las necesidades de los clientes y cómo afectan los objetivos del proyecto Descubrir procesos utilizando técnicas de visualización Comprender las causas del trabajo y cómo simplificar Búsqueda y eliminación de residuos del proceso Análisis gráfico para entender el desempeño del proceso Herramientas de resolución de problemas para determinar la causa raíz Creación de soluciones básicas Pilotaje e implementación Transferencia de proceso
mrkanar Análisis de Marketing con R 21 horas Audiencia: Dueños de negocios (gerentes de marketing, gerentes de producto, gerentes de base de clientes) y sus equipos; Profesionales del conocimiento del cliente. Visión de conjunto: El curso sigue el ciclo de vida del cliente, desde la adquisición de nuevos clientes, la gestión de los clientes existentes para la rentabilidad, la retención de buenos clientes y, finalmente, la comprensión de qué clientes nos están dejando y por qué. Trabajaremos con datos reales (si son anónimos) de una variedad de industrias, incluyendo telecomunicaciones, seguros, medios y alta tecnología. Formato: Entrenamiento dirigido por el instructor durante cinco sesiones de medio día con ejercicios en clase y tareas. Puede ser entregado como un curso de aula o distancia (en línea). Parte 1: Influxo - Adquisición de Nuevos Clientes Nuestro enfoque es la comercialización directa, por lo que no vamos a ver las campañas de publicidad, sino que nos centramos en la comprensión de las campañas de marketing (por ejemplo, correo directo). Esta es la base para casi todo lo demás en el curso. Miremos medir y mejorar la efectividad de la campaña. incluso: La importancia de los grupos de prueba y control. Grupo de control universal. Técnicas: Curvas de elevación, AUC Retorno de la inversión. Optimización de la inversión en marketing. ​ Parte 2: Gestión de Base: Gestión de Clientes Existentes Teniendo en cuenta el costo de la adquisición de nuevos clientes para muchas empresas, probablemente hay pocos activos más valiosos que su base de clientes existentes, aunque pocos piensan en ello de esta manera. Los temas incluyen: 1. La venta cruzada y up-selling: Ofrecer el producto o servicio correcto al cliente en el momento adecuado. Técnicas: Modelos RFM. Regresión multinomial. B. Valor de las compras de por vida. 2. Segmentación de clientes: comprensión de los tipos de clientes que tiene. Clasificación de los modelos utilizando primeros árboles de decisión simple, y luego Bosques aleatorios y otras técnicas más nuevas. Parte 3: Retención: Mantener a sus Buenos Clientes Comprender qué clientes es probable que deje y lo que puede hacer es clave para la rentabilidad en muchas industrias, especialmente donde hay repetición de compras o suscripciones. Observamos la propensión a los modelos de churn, Regresión logística: glm (stats de paquete) y técnicas más nuevas (especialmente gbm como una herramienta general) Modelos de ajuste (caret) e introducción a modelos de conjunto.
datashrinkgov Data Shrinkage para el Gobierno 14 horas Por qué reducir los datos? Bases de datos relacionales Introducción Agregación y desagregación Normalización y desnormalización Valores nulos y ceros Datos de unión Complejo se une Análisis de conglomerados Aplicaciones Fortalezas y debilidades Medición de la distancia Agrupación jerárquica K-medios y derivados Aplicaciones en el Gobierno Análisis factorial Conceptos Análisis factorial exploratorio Análisis factorial confirmatorio Análisis de componentes principales Análisis por correspondencia Software Aplicaciones en el Gobierno Análisis predictivo Líneas de tiempo y convenciones de nomenclatura Muestras de retención Pesos de evidencia Valor informativo Demostración de construcción de Scorecard usando una hoja de cálculo Regresión en el análisis predictivo Regresión logística en análisis predictivo Árboles de decisión en el análisis predictivo Redes neuronales Precisión de la medición Aplicaciones en el Gobierno
kylin Apache Kylin: From classic OLAP to real-time data warehouse 14 horas Apache Kylin is an extreme, distributed analytics engine for big data. In this instructor-led live training, participants will learn how to use Apache Kylin to set up a real-time data warehouse. By the end of this training, participants will be able to: Consume real-time streaming data using Kylin Utilize Apache Kylin's powerful features, including snowflake schema support, a rich SQL interface, spark cubing and subsecond query latency Note We use the latest version of Kylin (as of this writing, Apache Kylin v2.0) Audience Big data engineers Big Data analysts Format of the course Part lecture, part discussion, exercises and heavy hands-on practice To request a customized course outline for this training, please contact us.
statsman Estadísticas para Administradores 35 horas Este curso ha sido creado para tomadores de decisiones cuya meta principal no es hacer el cálculo y el análisis, sino entenderlos. El curso utiliza una gran cantidad de imágenes, diagramas, simulaciones por computadora, anécdotas y sentido del humor para explicar los conceptos y las trampas de las estadísticas. Introducción a las Estadísticas Qué son las estadísticas? Importancia de las estadísticas Estadísticas descriptivas Estadística inferencial Variables Percentiles Medición Niveles de medición Fundamentos de la recopilación de datos Distribuciones Notación de suma Transformaciones lineales Errores Comunes Muestras sesgadas Promedio, media o mediana? Gráficos engañosos Figuras semi-unidas Problema de la tercera variable Ceteris paribus Errores en el razonamiento Entendiendo el nivel de confianza Comprensión de los Resultados Describiendo datos bivariados Probabilidad Distribuciones normales Distribuciones de muestreo Estimacion Lógica de la Prueba de Hipótesis Medios de prueba Poder Predicción ANOVA Plaza Chi Estudios de Caso Discusión sobre casos de estudio elegidos por los delegados.
sspsspas Estadísticas con SPSS Software de Análisis Predictivo 14 horas Gol: Aprender a trabajar con SPSS a nivel de independencia Los destinatarios: Analistas, investigadores, científicos, estudiantes y todos aquellos que quieran adquirir la capacidad de utilizar el paquete SPSS y aprender técnicas de minería de datos populares. Uso del programa Los cuadros de diálogo Entrada / descarga de datos El concepto de escalas variables y de medida Preparar una base de datos Generar tablas y gráficos Formato del informe Sintaxis del lenguaje de comandos Análisis automatizado Procedimientos de almacenamiento y modificación Crear sus propios procedimientos analíticos Análisis de los datos Estadísticas descriptivas Términos clave: eg variable, hipótesis, significación estadística Medidas de tendencia central Medidas de dispersión Medidas de tendencia central Normalización Introducción a la investigación de las relaciones entre variables Métodos correlacionales y experimentales Resumen: Este estudio de caso y discusión
surveyrste Investigación en la Encuesta, Técnicas de Muestreo y Estimación 14 horas Investigación de la encuesta: Principio de diseño e implementación de la encuesta muestral Preliminares de la encuesta Métodos de muestreo (métodos de probabilidad y no probabilísticos) Marcos de muestreo y población Métodos de recogida de datos de encuestas Diseño del cuestionario Diseño y redacción de cuestionarios Pre-pruebas y pilotaje Planificación y organización de encuestas Minimizar los errores, los sesgos y la falta de respuesta en la etapa de diseño Procesamiento de datos de encuestas Comisionar encuestas / investigación Técnicas de muestreo y estimación: Técnicas de muestreo y sus fortalezas / debilidades (pueden superponerse a los métodos de muestreo anteriores) Muestreo aleatorio simple Muestreo de probabilidad desigual Muestreo estratificado (con proporción al tamaño y selección desproporcional) Muestreo sistemático Muestreo de grupos Muestreo en varias etapas Cuota de muestreo Estimacion Métodos de estimación de los tamaños de las muestras Estimación de parámetros de población usando estimaciones de muestra Estimación de los intervalos de varianza y confianza Estimación de sesgo / precisión Métodos de corrección del sesgo Métodos de manejo de datos faltantes Análisis de no respuesta
tbladv Tableau Avanzado 14 horas Introducción y Introducción 1. Filtrado, clasificación y agrupación Opciones avanzadas para filtrar y ocultar Comprender muchas opciones para ordenar y agrupar sus datos Ordenar, Grupos, Compartimientos, Conjuntos Interrelación entre todas las opciones 2. Trabajo con datos en Tableau Dimensión versus medidas Tipos de datos, Discreto versus Continuo Unirse a las fuentes de la base de datos, Inner, Left, Right join Mezclar diferentes orígenes de datos en una sola hoja de cálculo Trabajar con extractos en lugar de conexiones en vivo Problemas de calidad de datos Metadatos y compartir una conexión 3. Cálculos sobre datos y estadísticas Cálculos a nivel de fila Cálculos agregados Aritmética, cuerda, cálculos de fecha Agregaciones personalizadas y campos calculados Cálculos de flujo de control Lo que hay detrás de la escena Estadísticas avanzadas Trabajar con fechas y horas 4. Cálculos de la tabla Cálculos de tabla rápida Alcance y dirección Direccionamiento y partición Cálculos avanzados de tablas 5. Técnicas geográficas avanzadas Construyendo mapas básicos Campos geográficos, opciones de mapa Personalización de una vista geográfica Servicio de mapas web Visualización de datos no geográficos con imágenes de fondo Sugerencias de asignación Cálculos de distancia 6. Parámetros en el cuadro Creación de parámetros Parámetros en campos calculados Opciones de control de parámetros Mejora de análisis y visualizaciones con parámetros 7. Creación de visualizaciones avanzadas de gráficos Variaciones en el gráfico de barras: barrido, barra en barra, gráfico de puntos destacados Visualizaciones de fecha y hora, gráficos de gantt Barras apiladas, treemaps, gráficos de área, gráficos circulares Mapa de calor Gráfico de KPI diagrama de Pareto Gráfico de balas 8. Formato avanzado Etiquetas Leyendas Destacando Anotaciones 9. ​​​​​​​Cómo contar una historia de datos con Dashboards Marco del tablero de instrumentos Filtrar acciones Resalte las acciones Acciones de URL Filtros en cascada 10. Tendencias y pronósticos Entender y personalizar líneas de tendencia Distribuciones Predicción 11. Integración de Tableau y R para análisis avanzados de datos Posibilidad de incluir diferentes métodos de análisis de datos en R en la solicitud de los participantes
pgmt La Guía del Practicante de Técnicas Multivariantes 14 horas La introducción de la computadora digital, y ahora la disponibilidad generalizada de paquetes informáticos, ha abierto un área hasta ahora difícil de la estadística; analisis multivariable. Anteriormente, el formidable esfuerzo informático asociado a estos procedimientos presentaba una verdadera barrera. Esa barrera ahora ha desaparecido y el analista puede por lo tanto concentrarse en una apreciación y una interpretación de las conclusiones. Análisis Multivariado de Varianza (MANOVA) Mientras que la técnica de Análisis de Varianza (ANOVA) investiga las posibles diferencias sistemáticas entre prescribe grupos de individuos en una sola variable, la técnica de Análisis Multivariable de Varianza es simplemente una extensión de ese procedimiento a numerosas variables consideradas colectivamente. Estas variantes pueden ser de naturaleza distinta; Por ejemplo, Altura, Peso, etc., o medidas repetidas de una única variación en el tiempo o sobre el espacio. Cuando las variables son medidas repetidas en el tiempo o el espacio, los análisis pueden a menudo ser reducidos a una sucesión de análisis univariados, con una interpretación más fácil. Este procedimiento se refiere a menudo como Análisis de Mediciones Repetidas. Análisis de Componentes Principales Si sólo se registran dos variables para un número de individuos, los datos se pueden representar convenientemente en un diagrama bidimensional. Si hay variantes 'p', entonces uno podría imaginar una trama de los datos en 'p' espacio dimensional. La técnica de Análisis de Componentes Principales corresponde a una rotación de los ejes para que las cantidades máximas de variación se representen progresivamente a lo largo de los nuevos ejes. Se ha descrito como "penetración en el espacio multidimensional, desde cualquier ángulo concebible, y seleccionando como ángulo de visión el que contiene la máxima cantidad de variación". El objetivo es, por lo tanto, una reducción de la dimensionalidad de los datos multivariados. Si por ejemplo un porcentaje muy alto (digamos 90%) de la variabilidad está contenido en los dos primeros componentes principales, un diagrama de estos componentes sería una representación pictórica virtualmente completa de la variabilidad. Análisis Discriminante Supongamos que se observan varias variables en individuos de dos grupos identificados. La técnica del análisis discriminante implica calcular la función lineal de las variables que mejor separa a los grupos. Por tanto, la función lineal puede usarse para identificar la pertenencia a un grupo simplemente a partir del patrón de variantes. Existen varios métodos para estimar el éxito en general de este procedimiento de identificación. Análisis de la Variable Canónica El Análisis de Variables Canónicas es en esencia una extensión del Análisis Discriminante para acomodar la situación donde hay más de dos grupos de individuos. Análisis de Conglomerados Cluster Analysis como el nombre sugiere implica la identificación de agrupaciones (o clusters) de individuos en el espacio multidimensional. Dado que aquí no hay un agrupamiento "a priori" de individuos, la identificación de los llamados clusters es un proceso subjetivo sujeto a varias suposiciones. La mayoría de los paquetes de computadora ofrecen varios procedimientos de agrupación que a menudo pueden dar resultados diferentes. Sin embargo, la representación pictórica de los llamados "clusters", en diagramas llamados dendrogramas, proporciona un diagnóstico muy útil. Análisis Factorial Si se observan variantes 'p' en cada uno de los 'n' individuos, la técnica de análisis factorial intenta identificar 'r' (<p) denominados factores que determinan en gran medida los valores variables. Por lo tanto, la suposición implícita aquí es que todo el conjunto de variantes 'p' está controlado por factores 'r'. Por ejemplo, las variantes 'p' podrían representar el desempeño de los estudiantes en numerosos sujetos de examen, y deseamos determinar si algunos atributos tales como habilidad numérica, habilidad lingüística podrían explicar gran parte de la variabilidad. Las dificultades aquí derivan del hecho de que los llamados factores no son directamente observables, y de hecho pueden no existir realmente. El análisis de factores se ha visto con mucha sospecha a lo largo de los años, debido a la medida de la especulación involucrada en la identificación de factores. Un procedimiento numérico popular comienza con la rotación de ejes utilizando componentes principales (descritos anteriormente) seguidos por una rotación de los factores identificados.  
samr Análisis Estadístico en Investigación de Mercado 28 horas Objetivo: Mejora de los productos y servicios del taller del investigador del comportamiento del consumidor Destinatarios Los investigadores, analistas de mercado, gerentes y empleados de los departamentos de marketing, departamentos de ventas principalmente farmacéuticos y FMCG, estudiantes de socio-económicos y todos los interesados en estudios de mercado Módulo 1 Investigación Cuantitativa Resultados previos al tratamiento Comprobar la exactitud de la base de datos Control de datos faltantes Ponderación de las observaciones Modelos estadísticos regresión múltiple análisis conjunto Árboles de clasificación Automatizar los procedimientos de seguimiento de los estudios Análisis de datos de un experimento de marketing El informe y sacar conclusiones Módulo 2 Investigación Cualitativa La transformación de los datos cualitativos en una Modelos estadísticos para datos cualitativos
ModelFore4Gov Modelado y Predicción para el Gobierno 14 horas Sample Techniques & Estimation: Sampling techniques and their strengths/weaknesses (may overlap above sampling methods) Simple Random Sampling Unequal Probability Sampling Stratified Sampling (with proportional to size & disproportional selection) Systematic Sampling Cluster sampling Multi-stage Sampling  Quota Sampling Estimation Methods of estimating sample sizes  Estimating population parameters using sample estimates Variance and confidence intervals estimation Estimating bias/precision  Methods of correcting bias Methods of handling missing data Non-response analysis
dataar Análisis de Datos con R 21 horas R es un entorno de código abierto muy popular para la informática estadística, análisis de datos y gráficos. Este curso introduce el lenguaje de programación R a los estudiantes. Cubre los fundamentos del lenguaje, las bibliotecas y los conceptos avanzados. Análisis de datos y gráficos avanzados con datos del mundo real. Audiencia Desarrolladores / análisis de datos Duración 3 días Formato Conferencias y prácticas Día Uno: Bases del Idioma curso introductorio Acerca de la ciencia de los datos Definición de la ciencia de los datos Proceso de hacer la ciencia de los datos. Introducción al lenguaje R Variables y tipos Estructuras de control (Loops / Conditionals) R Escalares, vectores y matrices Definición de Vectores R Matricias Manipulación de texto y texto Tipo de datos de caracteres Archivo IO Liza Funciones Introducción a las funciones Cierres funciones lapply / sapply Marcos de datos Laboratorios para todas las secciones Dos: Programación Intermedia RDía ​​​​​​​DataFrames y E / S de archivos Leer datos de archivos Preparación de datos Conjuntos de datos incorporados Visualización Paquete de gráficos plot () / barplot () / hist () / boxplot () / diagrama de dispersión Mapa de calor Paquete ggplot2 (qplot (), ggplot ()) Exploración con Dplyr Laboratorios para todas las secciones Día 3: Programación Avanzada Con R Modelado estadístico con R Funciones estadísticas Tratar con NA Distribuciones (Binomial, Poisson, Normal) Regresión Introducción a las regresiones lineales Recomendaciones Procesamiento de texto (paquete tm / Wordclouds) Clustering Introducción al Clustering KMeans Clasificación Introducción a la clasificación Naive Bayes Árboles de decisión Entrenamiento usando paquete de caret Evaluación de algoritmos R y Big Data Conexión de R a bases de datos Gran ecosistema de datos Laboratorios para todas las secciones
rneuralnet Red Neuronal en R 14 horas Este curso es una introducción a la aplicación de redes neuronales en problemas del mundo real utilizando el software R-project. Introducción a las Redes Neuronales Qué son las redes neuronales? Cuál es el estado actual en la aplicación de redes neuronales Redes Neuronales vs modelos de regresión Aprendizaje supervisado y no supervisado Visión general de los paquetes disponibles Nnet, neuralnet y otros Diferencias entre los paquetes y las limitaciones de itls Visualización de redes neuronales Aplicación de redes neuronales Concepto de neuronas y redes neuronales Un modelo simplificado del cerebro Oportunidades neuronales Problema XOR y la naturaleza de la distribución de valores La naturaleza polimórfica de la sigmoide Otras funciones activadas Construcción de redes neuronales Concepto de neuronas conectadas Red neuronal como nodos Construyendo una red Neuronas Capas Escamas Datos de entrada y salida Rango 0 a 1 Normalización Redes neuronales de aprendizaje Propagación hacia atrás Propagación de pasos Algoritmos de entrenamiento en red Rango de aplicación Estimacion Problemas con la posibilidad de aproximación por Ejemplos OCR y reconocimiento de patrones de imagen Otras aplicaciones Implementación de un trabajo de modelado de redes neuronales que predice los precios
ImpEvalQuatAnal Evaluación de Impacto - Análisis Cuantitativo 14 horas Este curso cubre la evaluación de impacto y no cubre el diseño más amplio de las evaluaciones. Por qué evaluar El ciclo de vida de la evaluación Evaluación de Procesos e Impacto Contrafácticos y líneas de base Explorando sus opciones Ensayo de control aleatorizado Diferencia de diferencias (con ejercicio práctico) Diseño de discontinuidad de regresión Correspondencia de puntuación de propensión Series temporales interrumpidas Variables instrumentales
datavisR1 Introducción a la Visualización de Datos con R 28 horas Este curso está dirigido a ingenieros de datos, tomadores de decisiones y analistas de datos y te llevará a crear parcelas muy eficaces utilizando R studio que atraen a los tomadores de decisiones y les ayudan a encontrar información oculta y tomar las decisiones correctas Día 1: Visión general de la programación R Introducción a la visualización de datos Parcelas de dispersión y racimos El uso de ruido y nerviosismo Dia 2: Otro tipo de parcelas 2D y 3D Histogramas Cartas de calor Trazado de datos categóricos Día 3: Trazar los KPI con datos Ejemplos de gráficos R y X Cuadros de mandos Ejes paralelos Mezcla de datos categóricos con datos numéricos Día 4: Diferentes tipos de visualización de datos Tendencias disfrazadas y ocultas Estudios de caso Guardar gráficos y cargar archivos Excel
bigdatar Programming with Big Data in R 21 horas Introduction to Programming Big Data with R (bpdR) Setting up your environment to use pbdR Scope and tools available in pbdR Packages commonly used with Big Data alongside pbdR Message Passing Interface (MPI) Using pbdR MPI 5 Parallel processing Point-to-point communication Send Matrices Summing Matrices Collective communication Summing Matrices with Reduce Scatter / Gather Other MPI communications Distributed Matrices Creating a distributed diagonal matrix SVD of a distributed matrix Building a distributed matrix in parallel Statistics Applications Monte Carlo Integration Reading Datasets Reading on all processes Broadcasting from one process Reading partitioned data Distributed Regression Distributed Bootstrap
apacheh Capacitación de Administrador para Apache Hadoop 35 horas Audiencia: El curso está dirigido a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en un entorno de sistema distribuido Gol: Conocimiento profundo sobre administración de clúster de Hadoop. 1: HDFS (17%) Describir la función de Daemons HDFS Describir el funcionamiento normal de un clúster Apache Hadoop, tanto en el almacenamiento de datos como en el procesamiento de datos. Identificar las características actuales de los sistemas informáticos que motivan un sistema como Apache Hadoop. Clasifique los objetivos principales del diseño de HDFS Dado un escenario, identifique el caso de uso apropiado para la Federación HDFS Identificar los componentes y el daemon de un clúster HDFS HA-Quorum Analizar el papel de la seguridad HDFS (Kerberos) Determinar la mejor opción de serialización de datos para un escenario dado Describir rutas de lectura y escritura de archivos Identificar los comandos para manipular archivos en el Shell del sistema de archivos Hadoop 2: YARN y MapReduce versión 2 (MRv2) (17%) Comprender cómo la actualización de un clúster de Hadoop 1 a Hadoop 2 afecta a la configuración del clúster Entender cómo implementar MapReduce v2 (MRv2 / YARN), incluyendo todos los daemons YARN Entender la estrategia básica de diseño de MapReduce v2 (MRv2) Determinar cómo YARN gestiona las asignaciones de recursos Identificar el flujo de trabajo de MapReduce que se ejecuta en YARN Determine qué archivos debe cambiar y cómo migrar un clúster de MapReduce versión 1 (MRv1) a MapReduce versión 2 (MRv2) que se ejecuta en YARN. 3: Hadoop Cluster Planning (16%) Principales puntos a considerar al elegir el hardware y los sistemas operativos para alojar un clúster Apache Hadoop. Analizar las opciones al seleccionar un sistema operativo Comprender la afinación del núcleo y el intercambio de discos Dado un escenario y un patrón de carga de trabajo, identifique una configuración de hardware adecuada al escenario Dado un escenario, determine los componentes del ecosistema que su clúster necesita ejecutar para cumplir con el SLA Dimensionamiento del clúster: dado el escenario y la frecuencia de ejecución, identifique los detalles de la carga de trabajo, incluyendo CPU, memoria, almacenamiento, E / S de disco Tamaño y configuración del disco, incluidos JBOD frente a RAID, SAN, virtualización y requisitos de tamaño de disco en un clúster Topologías de red: comprender el uso de la red en Hadoop (para HDFS y MapReduce) y proponer o identificar componentes clave de diseño de red para un escenario dado 4: Instalación y administración de clústeres Hadoop (25%) Dado un escenario, identifique cómo el clúster manejará fallas de disco y máquina Analizar una configuración de registro y registrar el formato de archivo de configuración Comprender los conceptos básicos de las métricas de Hadoop y el monitoreo de la salud de los clústeres Identificar la función y el propósito de las herramientas disponibles para el monitoreo de clusters Ser capaz de instalar todos los componentes del ecosistema en CDH 5, incluyendo (pero no limitado a): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive y Pig Identificar la función y el propósito de las herramientas disponibles para administrar el sistema de archivos Apache Hadoop 5: Gestión de recursos (10%) Entender los objetivos generales de diseño de cada uno de los planificadores de Hadoop Dado un escenario, determine cómo el Planificador FIFO asigna recursos de clúster Dado un escenario, determine cómo el planificador justo asigna los recursos del clúster bajo YARN Dado un escenario, determine cómo el Programador de capacidad asigna recursos de clúster 6: Monitoreo y registro (15%) Comprender las funciones y características de las capacidades de recopilación de métricas de Hadoop Analizar las interfaces de usuario de Web de NameNode y JobTracker Entender cómo supervisar demonios de clúster Identificar y supervisar el uso de la CPU en los nodos maestros Describir cómo supervisar la asignación de intercambio y memoria en todos los nodos Identificar cómo ver y administrar los archivos de registro de Hadoop Interpretar un archivo de registro
rlang R 21 horas Día 1 Introducción y preliminares Haciendo R más amigable, R y GUIs disponibles Rstudio Software y documentación relacionados R y estadísticas Uso de R de forma interactiva Una sesión introductoria Obtención de ayuda con funciones y funciones R, sensibilidad de mayúsculas y minúsculas, etc. Recuperación y corrección de comandos anteriores Ejecutar comandos o desviar la salida a un archivo Permanencia de datos y eliminación de objetos Manipulaciones sencillas; Números y vectores Vectores y asignación Aritmética vectorial Generación de secuencias regulares Vectores lógicos Valores faltantes Vectores de caracteres Vectores índice; Seleccionar y modificar subconjuntos de un conjunto de datos Otros tipos de objetos Objetos, sus modos y atributos Atributos intrínsecos: modo y longitud Cambiar la longitud de un objeto Obtención y configuración de atributos La clase de un objeto Factores ordenados y no ordenados Un ejemplo específico La función tapply () y arrays irregulares Factores ordenados Matrices y matrices Matrices Indexación de matrices. Subsecciones de una matriz Matrices de índice La función array () Aritmética mixta de vector y aritmética. La regla de reciclaje El producto externo de dos matrices Transposición generalizada de una matriz Instalaciones Matrix Multiplicación de matrices Ecuaciones lineales e inversión Valores propios y vectores propios Descomposición de valores singulares y determinantes Ajuste de mínimos cuadrados y descomposición QR Formando matrices particionadas, cbind () y rbind () La función de concatenación, (), con arrays Tablas de frecuencia de factores Dia 2 Listas y marcos de datos Liza Construir y modificar listas Concatenar listas Marcos de datos Realización de marcos de datos Attach () y detach () Trabajar con marcos de datos Adjuntar listas arbitrarias Gestión de la ruta de búsqueda Manipulación de datos Selección, subconjunto de observaciones y variables Filtrado, agrupación Recodificación, transformaciones Agregación, combinación de conjuntos de datos Manipulación de caracteres, paquete stringr Lectura de datos Archivos Txt Archivos CSV XLS, XLSX archivos SPSS, SAS, Stata, ... y otros formatos de datos Exportar datos a txt, csv y otros formatos Acceso a datos desde bases de datos utilizando lenguaje SQL Distribuciones de probabilidad R como conjunto de cuadros estadísticos Examinar la distribución de un conjunto de datos Pruebas de una y dos muestras Agrupación, bucles y ejecución condicional Expresiones agrupadas Declaraciones de control Ejecución condicional: si declaraciones Ejecución repetitiva: para bucles, repetición y mientras Día 3 Escribir sus propias funciones Ejemplos sencillos Definición de nuevos operadores binarios Argumentos y valores predeterminados El argumento Asignaciones dentro de las funciones Ejemplos más avanzados Factores de eficiencia en los diseños de bloques Eliminación de todos los nombres de un conjunto impreso Integración numérica recursiva Alcance Personalización del entorno Clases, funciones genéricas y orientación a objetos Análisis estadístico en R Modelos de regresión lineal Funciones genéricas para extraer la información del modelo Actualización de modelos adaptados Modelos lineales generalizados Familias La función glm () Clasificación Regresión logística Análisis Discriminante Lineal Aprendizaje sin supervisión Análisis de componentes principales Clustering Métodos (k-medios, agrupación jerárquica, k-medoids) Análisis de supervivencia Objetos de supervivencia en r Estimación Kaplan-Meier Bandas de confianza Modelos Cox PH, covariables constantes Cox PH modelos, covariables dependientes del tiempo Procedimientos gráficos Comandos de trazado de alto nivel La función plot () Visualización de datos multivariados Mostrar gráficos Argumentos a funciones de trazado de alto nivel Gráficos de visualización básicos Relaciones multivariantes con el paquete de celosía y ggplot Uso de parámetros gráficos Lista de parámetros gráficos Informes automatizados e interactivos Combinación de salida de R con texto
advr Avanzada R 7 horas Rstudio IDE Manipulación de datos con dplyr, tidyr, reshape2 Programación orientada a objetos en R Perfilado de rendimiento Manejo de excepciones Depuración del código R Creando paquetes R Investigación reproducible con knitr y RMarkdown C / C ++ codificación en R Escribir y compilar el código C / C ++ de R
rintro Introducción a R 21 horas R es un lenguaje de programación libre de código abierto para la informática estadística, análisis de datos y gráficos. R es utilizado por un número creciente de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R también ha encontrado seguidores entre los estadísticos, ingenieros y científicos sin habilidades de programación de computadoras que encuentran fácil de usar. Su popularidad se debe al creciente uso de la minería de datos para varios objetivos, como fijar los precios de los anuncios, encontrar nuevos medicamentos más rápidamente o ajustar los modelos financieros. R tiene una gran variedad de paquetes para la minería de datos. Este curso cubre la manipulación de objetos en R incluyendo la lectura de datos, el acceso a paquetes R, la escritura de funciones R, y la elaboración de gráficos informativos. Incluye el análisis de datos utilizando modelos estadísticos comunes. El curso enseña cómo utilizar el software R (http://www.r-project.org) tanto en una línea de comandos como en una interfaz gráfica de usuario (GUI). Introducción y Preliminares Haciendo R más amigable, R y GUIs disponibles El entorno R Software y documentación relacionados R y estadísticas Uso de R de forma interactiva Una sesión introductoria Obtención de ayuda con funciones y funciones R, sensibilidad de mayúsculas y minúsculas, etc. Recuperación y corrección de comandos anteriores Ejecutar comandos o desviar la salida a un archivo Permanencia de datos y eliminación de objetos Manipulaciones Sencillas; Números y Vectores Vectores y asignación Aritmética vectorial Generación de secuencias regulares Vectores lógicos Valores faltantes Vectores de caracteres Vectores índice; Seleccionar y modificar subconjuntos de un conjunto de datos Otros tipos de objetos Objetos, sus Modos y Atributos Atributos intrínsecos: modo y longitud Cambiar la longitud de un objeto Obtención y configuración de atributos La clase de un objeto Factores Ordenados y no Ordenados Un ejemplo específico La función tapply () y arrays irregulares Factores ordenados Matrices y Matrices Matrices Indexación de matrices. Subsecciones de una matriz Matrices de índice La función array () Aritmética mixta de vector y aritmética. La regla de reciclaje El producto externo de dos matrices Transposición generalizada de una matriz Instalaciones Matrix Multiplicación de matrices Ecuaciones lineales e inversión Valores propios y vectores propios Descomposición de valores singulares y determinantes Ajuste de mínimos cuadrados y descomposición QR Formando matrices particionadas, cbind () y rbind () La función de concatenación, (), con arrays Tablas de frecuencia de factores Listas y Marcos de Datos Liza Construir y modificar listas Concatenar listas Marcos de datos Realización de marcos de datos Attach () y detach () Trabajar con marcos de datos Adjuntar listas arbitrarias Gestión de la ruta de búsqueda Leer Datos de Archivos La función read.table () La función scan () Acceso a los conjuntos de datos incorporados Cargando datos de otros paquetes R Edición de datos Distribuciones de Probabilidad R como conjunto de cuadros estadísticos Examinar la distribución de un conjunto de datos Pruebas de una y dos muestras Agrupación, Bucles y Ejecución Condicional Expresiones agrupadas Declaraciones de control Ejecución condicional: si declaraciones Ejecución repetitiva: repetición de bucles y mientras que Escribir sus Propias Funciones Ejemplos sencillos Definición de nuevos operadores binarios Argumentos y valores predeterminados El argumento Asignaciones dentro de las funciones Ejemplos más avanzados Factores de eficiencia en los diseños de bloques Eliminación de todos los nombres de un conjunto impreso Integración numérica recursiva Alcance Personalización del entorno Clases, funciones genéricas y orientación a objetos Modelos Estadísticos en R Definición de modelos estadísticos; Fórmulas Contrastes Modelos lineales Funciones genéricas para extraer la información del modelo Análisis de varianza y comparación de modelos Tablas ANOVA Actualización de modelos adaptados Modelos lineales generalizados Familias La función glm () Modelos no lineales de mínimos cuadrados y de máxima verosimilitud Mínimos cuadrados Máxima verosimilitud Algunos modelos no estándar Procedimientos Gráficos Comandos de trazado de alto nivel La función plot () Visualización de datos multivariados Mostrar gráficos Argumentos a funciones de trazado de alto nivel Comandos de trazado de bajo nivel Anotación matemática Fuentes vectoriales de Hershey Interacción con gráficos Uso de parámetros gráficos Cambios permanentes: La función par () Cambios temporales: Argumentos a funciones gráficas Lista de parámetros gráficos Elementos gráficos Ejes y marcas Margen de la figura Entorno de múltiples figuras Controladores de dispositivo Diagramas PostScript para documentos tipográficos Múltiples dispositivos gráficos Gráficos dinámicos Paquetes Paquetes estándar Paquetes aportados y CRAN Espacios de nombres          
rdataana R para Análisis de Datos e Investigación 7 horas Audiencia Gerentes Desarrolladores Científicos Estudiantes Formato del curso Instrucción y discusión en línea o talleres cara a cara La siguiente lista ofrece una idea de los temas que se tratarán en el taller. El número de temas que se cubrirán depende de la duración del taller (es decir, uno, dos o tres días). En un taller de uno o dos días puede que no sea posible cubrir todos los temas, por lo que el taller se adaptará a las necesidades específicas de los estudiantes. Sintaxis para el análisis de matrices de datos unidimensionales Sintaxis para analizar matrices de datos bidimensionales Leer y escribir archivos de datos Subfijación de datos, ordenación, clasificación y pedidos de datos Fusionar matrices Establecer membresía Las principales funciones estadísticas en R La Distribución Normal (correlación, probabilidades, pruebas de normalidad e intervalos de confianza) Regresión de mínimos cuadrados ordinarios Pruebas T, Análisis de Varianza y Análisis Multivariable de Varianza Pruebas de Chi cuadrado para variables categóricas Funciones de escritura en R Software de escritura (scripts) en R Estructuras de control (por ejemplo, bucles) Métodos gráficos (incluyendo diagramas de dispersión, gráficos de barras, gráficos circulares, histogramas, diagramas de bloques y gráficos de puntos) Interfaces gráficas de usuario para R
frcr Pronosticar con R 14 horas Este curso permite a los delegados automatizar completamente el proceso de pronóstico con R Pronosticar con R Introducción a la previsión Suavizado Exponencial Modelos ARIMA El paquete de previsiones Paquete "pronóstico" Exactitud Acf Arfima Arima Arima.errors Auto.arima Murciélagos BoxCox BoxCox.lambda Croston CV Dm.test Dshw Ets Adaptado arima Pronóstico Pronóstico.Arima Pronósticos Pronósticos Pronóstico.HoltWinters Pronóstico Forecast.stl Previsiones Gas Oro LogLik.ets Mamá Media de Mes días Msts Na.interp Ingenuo Ndiffs Nnetar Trampas Juegos de trama Ploteo Rwf Mar abierto Temporada baja Seasonplot Ses Simulate.ets Pecado Splinef Subconjuntos Taylor Tbats La tercera parte Tsdisplay Tslm Wineind Woolyrnq

Próximos Cursos

Other regions

Cursos de Fin de Semana de Estadísticas, Capacitación por la Tarde de Estadísticas, Estadísticas boot camp, Clases de Estadísticas , Estadísticas en sitio, Instructor de Estadísticas, Clases de Estadísticas , Programas de capacitación de Estadísticas, Talleres para empresas de Estadísticas, Capacitador de Estadísticas, Cursos de Formación de Estadísticas, Estadísticas con instructor, Clases Particulares de Estadísticas, Estadísticas coaching, Cursos Privados de Estadísticas, Capacitación empresarial de Estadísticas, Cursos por la Tarde de Estadísticas, Cursos en linea de Estadísticas

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No vamos a pasar o vender su dirección a otros.
Siempre puede cambiar sus preferencias o anular la suscripción por completo.

Algunos de nuestros clientes