miércoles, 10 de junio de 2020

3.3 Definiciones: Replica, corrida, estado transitorio, estado estable, condiciones iniciales, reloj de la simulación

REPLICA:

Las réplicas son múltiples corridas experimentales con la misma configuración de factores (niveles). Las réplicas están sujetas a las mismas fuentes de variabilidad, de forma independiente unas de otras. Usted puede replicar combinaciones de niveles de factores, grupos de combinaciones de niveles de factores o diseños enteros.
Cuando ejecutamos el modelo en una ocasión, los valores que obtenemos de las variables y parámetros  al final del tiempo de simulación generalmente serán distintos de los que se producirán si lo volvemos a correr usando diferentes números pseudoaleatorios. Por lo tanto, es necesario efectuar más de una réplica del modelo que se está analizando con la finalidad de obtener estadísticas de intervalo  que os den una mejor ubicación del verdadero valor de la variable bajo los diferentes escenarios que se presentan al modificar los números pseudo aleatorios en cada oportunidad.


CORRIDA:

Corridas comunes: El objetivo principal es iniciar nuevas corridas de simulación utilizando siempre los datos almacenados; de esta forma, el uso de las corridas comunes afecta a todas las alternativas de igual forma. Se debe aplicar cuando el problema consiste en la comparación de dos o más alternativas.
Una prueba de Corridas es un método que nos ayuda a evaluar el carácter de aleatoriedad de una secuencia de números estadísticamente independientes y números uniformemente distribuidos. Es decir dado una serie de números determinar si son o no aleatorios.

ESTADO ESTABLE:

Una variable está en estado estacionario (estable) si su valor esperado es el mismo durante el período de tiempo que estamos considerando.
Una simulación está en estado estacionario (estable) si todas sus colas están en estado estacionario. El estado estacionario es alcanzado luego de un período de tiempo llamado período transitorio inicial (run-in).

CONDICIONES INICIALES:

 Valores iniciales de las variables de estado.


RELOJ DE LA SIMULACIÓN:

Es el contador de tiempo de la simulación, y su función consiste en responder preguntas tales como cuánto tiempo se ha utilizado el modelo de la simulación, y cuanto tiempo en total se requiere que dure esta última. Existen dos tipos de reloj de simulación:
El reloj de simulación absoluto, que parte del cero y termina en un tiempo total disimulación definido.

 El reloj de simulación relativo, que solo consiste en el lapso de tiempo que transcurre entre dos eventos.

 Ejemplo El tiempo de proceso de una pieza es relativo, mientras que el tiempo absoluto seria el global: desde que la pieza entro a ser procesada hasta el momento que terminó su proceso.

3.2.4 Establecer el efecto sobre la variabilidad de un estimador tiene el tamaño de la simulación.

Concepto Monte Carlo


La Simulación de Monte Carlo es una técnica que permite llevar a cabo la valoración de los proyectos de inversión considerando que una, o varias, de las variables que se utilizan para la determinación de los flujos netos de caja no son variables ciertas, sino que pueden tomar varios valores.

 1. La estimación de las variables

Aplicación:
 En primer lugar hay que seleccionar el modelo matemático que se va a utilizar


Valor Actual Neto (VAN)

Tasa Interna de Rentabilidad (TIR)

 Según el valor obtenido para estos métodos de valoración se tomará la decisión de si el proyecto es rentable y se lleva a cabo, o no. identificar las variables cuyo comportamiento se va a simular (X) Es decir, aquellas que se consideran que no van a tomar un valor fijo, sino que pueden tomar un rango de valores por no tratarse de variables ciertas Si no se tuvieran en cuenta dichas interrelaciones, y se simularan las variables de forma independiente, se estaría incurriendo en un error en los resultados obtenidos, y se reduciría la variabilidad de los resultados al tener lugar el efecto de compensación en la interacción de las variables.

2. Estimación del tamaño de la muestra Para determinar el tamaño de la muestra, se empezará utilizando un número no demasiado elevado de simulaciones, que se sustituirán en el modelo matemático seleccionado, y se calculará la media y la desviación típica correspondiente al mismo.


 Metodología de cálculo

La aplicación del método de Monte Carlo para valorar inversiones plantea dos aspectos fundamentales; la estimación de las variables y la determinación del tamaño de la muestra.

Simular la realidad a través del estudio de una muestra, que se ha generado de forma totalmente aleatoria. Resulta, por tanto, de gran utilidad en los casos en los 29 que no es posible obtener información sobre la realidad a analizar, o cuando la experimentación no es posible, o es muy costosa.

-Una vez identificadas las variables que se van a simular, hay que determinar la función de densidad de probabilidad f(x) asociada a cada una de ellas.

 - Posteriormente, se obtendrán las funciones de distribución asociadas a las variables (o variable).

Z = f(x), donde "x" es la variable desconocida a simular

- A continuación, se sustituyen los valores simulados en el modelo matemático para ver el resultado obtenido para las simulaciones realizadas.

- Posteriormente, se agrupan y clasifican los resultados. Se comparan los casos favorables, con los casos posibles, y se agrupan por categorías de resultados.

- Para finalizar, se lleva a cabo el análisis estadístico y de inferencia sobre el comportamiento de la realidad, siendo interesante calcular la media, la varianza y la desviación típica.

- Procedimiento aditivo: se parte de un número inicial de simulaciones (n), y se calcula la media y la desviación típica del modelo matemático utilizado.

 -Se calcula la media y la desviación típica del modelo matemático utilizando para ello un número de simulaciones que asciende a "2n".


 Ejemplo: Paso 1: Tamaño del bloque de simulaciones "n". Paso 2: Tamaño del bloque de simulaciones "n+n = 2n". Si no hay convergencia, entonces paso 3, sino finalizar.

Paso 3: Tamaño del bloque de simulaciones "2n+n = 3n". Si no hay convergencia, entonces paso 4, sino finalizar.

 Y así, sucesivamente hasta alcanzar la convergencia.

- Procedimiento multiplicativo: se parte de un número inicial de simulaciones (n), y se calcula la media y la desviación típica del modelo matemático utilizado. A continuación se procede a añadir un número de nuevas simulaciones equivalente a las acumuladas hasta ese momento, de tal forma que ahora se calcula la media y la desviación típica del modelo matemático utilizando.

 Obtenemos la variabilidad del nuevo bloque de simulaciones tiene el mismo peso sobre el total que la del bloque anterior, siendo por tanto en un método más perfecto.


Ejemplo: Paso 1: Tamaño del bloque de simulaciones "n".

Paso 2: Tamaño del bloque de simulaciones "2xn = 2n". Si no hay convergencia, entonces paso 3, sino finalizar.

Paso 3: Tamaño del bloque de simulaciones "2x2n = 4n". Si no hay convergencia, entonces paso 4, sino finalizar.

3.2.1 Descripción y conceptualización de la simulación, establecer el problema, especificación del objetivo (s), definición de indicadores, simulación y determinación de la muestra.

Simulación :

Es la construcción de modelos informáticos que describen la parte esencial del comportamiento de un sistema de interés, así como diseñar y realizar experimentos con el modelo y extraer conclusiones de sus resultados para apoyar la toma de decisiones.

Se usa como un paradigma para analizar sistemas complejos. La idea es obtener una representación simplificada de algún aspecto de interés de la realidad.

Permite experimentar con sistemas (reales o propuestos) en casos en los que de otra manera esto sería imposible o impráctico.






El sistema simulado imita la operación del sistema actual sobre el tiempo.

La historia artificial del sistema puede ser generado, observado y analizado.

La escala de tiempo puede ser alterado según la necesidad.

Las conclusiones acerca de las características del sistema actual pueden ser inferidos.


 Estructura de un modelo de simulación








ci: variable exógena controlable
 ni: variable exógena no controlable
ei: variable endógena (estado del sistema)
si: variable endógena (salida del sistema)




La formulación de los modelos de simulación requiere de la cuantificación de los parámetros de las variables. Cuando se dispone de datos históricos el proceso inicia con la recolección de datos a los cuales se les denomina datos en bruto (raw data) y posteriormente se les organiza en histogramas los que sirven de base para formular los modelos matemáticos que describen su comportamiento. Es necesario estimar los valores de los parámetros de dichos modelos y probar su significación estadística con respecto a la bondad de ajuste de las distribuciones de probabilidad. La estimación de parámetros de los modelos estocásticos cae dentro del dominio de la estadística. Estas acciones son lo que se conoce como evaluación del modelo.


La etapa final del estudio de simulación consiste en validar el modelo a través del análisis de los datos simulados y debemos responder a las preguntas ¿qué tan bien coinciden los valores simulados de las variables endógenas con datos históricos conocidos, si es que éstos están disponibles? y ¿qué tan exactas son las predicciones del comportamiento del sistema real hechas por el modelo de simulación, para períodos futuros?. El análisis se lleva a cabo en tres pasos:

1. Recolección y procesamiento de los datos simulados.
 2. Cálculo de la estadística de las pruebas.
3. Interpretación de los resultados.



Como se puede inferir, nuevamente tendremos que aplicar los conceptos estadísticos que se utilizaron en la formulación del modelo.

Obtener las entradas y las salidas, relaciones cuantitativas y cualitativas. Los datos deben ser convenientemente tratados para que se puedan realizar predicciones del comportamiento del sistema. Si nos quedamos con los datos como los obtenemos del sistema real, podemos caer en la mera simulación del pasado. Si basados en ellos hallamos una función del comportamiento, estaremos en condiciones de repetir el comportamiento del sistema en el modelo y poder aplicarlo para realizar estudios sobre el mismo.

Con el modelo definido, el siguiente paso es decir si utiliza algún lenguaje como el FROTAN, ALGOL, LIPS, etc., o se utiliza algún simulador como PROMODEL, VENSIM; STELLA, ITHINK, GPSS, SIMULA, SIMSCRIP, ROKCWELL, ARENA, FLEXSIM, etc. para el procesarlo en la computadora y obtener resultados deseados.


EL PROBLEMA

 Formulación y definición del sistema 

Se inicia en la administración de la empresa. Quién sabe que tiene un problema, pero no sabe definirlo.

1. La formulación del problema no se hace una sola vez, se hace a través de todo el proyecto.

2. Se define los objetivos del estudio (objetivos y metas).

3. Se define el sistema a estudiar.

4. Se define los límites del sistemas , sus alcances y limitaciones (restricciones de la abstracción).

5. Se especifica el diagrama de flujo lógico.


Problemas, Objetivos y Metas

Problema. 
• Alguna amenaza, incremento de costos, información desconocida, riesgos o contradicciones. Se plantea como un conjunto de síntomas, aún no se conoce las causas.

Objetivo.
• Resolver el problema o cómo resolver el problema.
• El objetivo no es conocer las causas del problema. Se orienta a la solución del problema.

Meta
• Conjunto de actividades para lograr el objetivo planteado.
Por lo general se puede medir

 2. RECOLECCIÓN DE DATOS

Recolección de datos
• Se recopila datos de la realidad con la finalidad de estimar las variables y parámetros de entrada

. • Se debe decidir:
 – Cómo recopilar la información
 – Qué datos se necesita y si son importantes.

• En caso de tener variables aleatorias:
 – Identificar la distribución de frecuencias.
 – Verificar si la distribución no cambia en el tiempo.
 – Validar la sensibilidad del modelo ante diferentes distribuciones de probabilidad.

3. EL MODELO

Formulación del modelo

 • Es la reducción o abstracción del sistema real a un diagrama de flujo lógico, donde se identifican los elementos, las variables y los eventos importantes para cumplir el objetivo del estudio.

 • Se define el nivel de detalle del estudio (o nivel de simplificación).

– Un modelo detallado puede implicar mucho tiempo en su implementación.
 – Un modelo simplificado no le va ha permitir lograr el objetivo planteado.

 Estructura del Sistema
• Gráfico del Sistema.
• Elementos del Sistema.

– Entidades.
 – Atributos.
– Actividades.

• Análisis del Sistema
– Eventos.
 – Eventos Principales
– DRE

 • Variables
– Tiempo.
– Contadores
 – Estado del Sistema

• Diagrama de Flujo
 – Programa Principal
 – Eventos Principales

• Variables Aleatorias

 – Distribución Frecuencia Traslación del modelo

• Se decide el lenguaje de programación o el software de simulación a usar.

 • Software de Simulación 24 – GPSS, Arena, Simscript, Simula, Promodel.

– Dynamo, Powersim

 • Lenguajes de Propósito General

– Java, C, Pascal, Delphi, Visual Basic, etc

4.VERIFICACIÓN

Verificación y Validación

 • Es el proceso de llevar a un nivel de confianza del usuario referente a cualquier inferencia acerca de un sistema es correcta.
 • Pero no se puede probar si un simulador es correcto o “verdadero”.
• Lo que importa es la utilidad operativa del modelo y no la verdad de su estructura.
• No existe la “prueba” de validación de un modelo.

• Se hacen pruebas a lo largo de su desarrollo:

 – Validar la sensibilidad del modelo.
 – Prueba de las suposiciones.
 – Prueba de transformaciones E-S Verificación

 • Para asegurar que el modelo se comporta de la manera que el experimentador desea.

• Se verificar si el modelo está correctamente construido.

 • Se verifica si el modelo se ha construido de acuerdo a las especificaciones.

 • Se realiza por inspección a lo largo del proyecto.

 5. VALIDACIÓN

Validación

• Prueba la concordancia entre el desempeño del modelo y el desempeño del sistema real.
• Examina el ajuste del modelo a cierta dato empírica.
• Un bueno modelo es aquel que se ajusta mejor a los datos y por lo tanto se puede usar para predecir la realidad.
• Todos los modelos de simulación corresponden a hipótesis sujeta a validación.

6. EXPERIMENTACIÓN

Experimentación

• Una vez validado el modelo se realiza la experimentación que consiste en generar los datos deseados y realizar el análisis de sensibilidad de los índices requeridos.

• El análisis de sensibilidad consiste en variar los parámetros del sistema y la observación del efecto en la variable de interés Planeación Estratégica

• Se relaciona a cómo diseñar y experimentar con el modelo de simulación, con la finalidad de:

– Reducir el número de pruebas experimentales.
 – Proporcionar una estructura para el proceso de aprendizaje del investigador.

• Los objetivos de la experimentación son:

– Encontrar la combinación valores de parámetros que optimizan la variable de interés.
 – Explicar la relación entre la variable de interés y las variables controlables.

 • La experimentación ayuda a conocer el sistema materia de la simulación.


7. RESULTADOS

Interpretación

• En esta etapa se realiza la interpretación de los resultados que arroja la simulación y basándose en esto se toma una decisión.

 • Se determina si el modelo de simulación es útil para resolver el problema planteado al inicio de la investigación.
 • Posiblemente ahora con más conocimiento de causa se puede determinar con mayor precisión ¿cuál es el problema a resolver?

 8. DOCUMENTACIÓN

Documentación

• Ayuda a incrementar la vida útil del modelo.
• Se relaciona al proceso de desarrollo, operación e implantación del modelo de simulación.
 • Ayuda al modelador a reconocer sus propios errores y mejorar para un siguiente proyecto de simulación Modelo de Informe Final

9. IMPLANTACIÓN 

Implantación
• Para que un proyecto de simulación sea exitoso se deben dar 3 condiciones:
• Sea aceptado, entendido y usado

3.2 Ejemplo de una simulación tipo Montecarlo, en hoja de cálculo

La simulación de Monte Carlo es una técnica que combina conceptos estadísticos (muestreo aleatorio) con la capacidad que tienen los ordenadores para generar números pseudo-aleatorios y automatizar cálculos.
  Los orígenes de esta técnica están ligados al trabajo desarrollado por Stan Ulam y John Von Neumann a finales de los 40 en el laboratorio de Los Alamos, cuando investigaban el movimiento aleatorio de los neutrones [W1]. En años posteriores, la simulación de Monte Carlo se ha venido aplicando a una infinidad de ámbitos como alternativa a los modelos matemáticos exactos o incluso como único medio de estimar soluciones para problemas complejos. Así, en la actualidad es posible encontrar modelos que hacen uso de simulación Monte Carlo en las áreas informática, empresarial, económica, industrial e incluso social [5, 8]. En otras palabras, la simulación de Monte Carlo está presente en todos aquellos ámbitos en los que el comportamiento aleatorio o probabilístico desempeña un papel fundamental -precisamente, el nombre de Monte Carlo proviene de la famosa ciudad de Mónaco, donde abundan los casinos de juego y donde el azar, la probabilidad y el comportamiento aleatorio conforman todo un estilo de vida. Son muchos los autores que han apostado por utilizar hojas de cálculo para realizar simulación Monte Carlo [1, 6, 7]. La potencia de las hojas de cálculo reside en su universalidad, en su facilidad de uso, en su capacidad para recalcular valores y, sobre todo, en las posibilidades que ofrece con respecto al análisis de escenarios (“what-if anaylisis”). Las últimas versiones de Excel incorporan, además, un lenguaje de programación propio, el Visual Basic for Applications, con el cual es posible crear auténticas aplicaciones de simulación destinadas al usuario final. En el mercado existen de hecho varios complementos de Excel (AddIns) específicamente diseñados para realizar simulación Monte Carlo, siendo los más conocidos: @Risk, Crystall Ball, Insight.xla, SimTools.xla, etc. [W2 – W5].


Conceptos fundamentales La función ALEATORIO () de Excel Las hojas de cálculo como Excel (y cualquier lenguaje de programación estándar) son capaces de generar números pseudo-aleatorios provenientes de una distribución uniforme entre el 0 y el 1. Este tipo de números pseudo-aleatorios son los elementos básicos a partir de los cuales se desarrolla cualquier simulación por ordenador. En Excel, es posible obtener un número pseudo-aleatorio -proveniente de una distribución uniforme entre el 0 y el 1- usando la función ALEATORIO:






Los números generados mediante la función ALEATORIO tienen dos propiedades que los hacen equiparables a números completamente aleatorios: 1. Cada vez que se usa la función ALEATORIO, cualquier número real entre 0 y 1 tiene la misma probabilidad de ser generado (de ahí el nombre de distribución uniforme). 2. Los diferentes números generados son estadísticamente independientes unos de otros (es decir, el valor del número generado en un momento dado no depende de los generados con anterioridad). La función ALEATORIO es una función volátil de Excel. Esto significa que cada vez que pulsamos la tecla F9 o cambiemos alguno de los inputs del modelo, todas las celdas donde aparezca la función ALEATORIO serán recalculadas de forma automática. Se pueden encontrar ejemplos del uso de ALEATORIO en el propio menú de ayuda de Excel. ¿Qué es la simulación de Monte Carlo? La simulación de Monte Carlo es una técnica cuantitativa que hace uso de la estadística y los ordenadores para imitar, mediante modelos matemáticos, el comportamiento aleatorio de sistemas reales no dinámicos (por lo general, cuando 6 se trata de sistemas cuyo estado va cambiando con el paso del tiempo, se recurre bien a la simulación de eventos discretos o bien a la simulación de sistemas continuos). La clave de la simulación Monte Carlo consiste en crear un modelo matemático del sistema, proceso o actividad que se quiere analizar, identificando aquellas variables (inputs del modelo) cuyo comportamiento aleatorio determina el comportamiento global del sistema. Una vez identificados dichos inputs o variables aleatorias, se lleva a cabo un experimento consistente en (1) generar – con ayuda del ordenador-muestra aleatorio (valores concretos) para dichos inputs, y (2) analizar el comportamiento del sistema ante los valores generados. Tras repetir n veces este experimento, dispondremos de n observaciones sobre el comportamiento del sistema, lo cual nos será de utilidad para entender el funcionamiento del mismo –obviamente, nuestro análisis será tanto más preciso cuanto mayor sea el número n de experimentos que llevemos a cabo. Veamos un ejemplo sencillo: En la imagen inferior se muestra un análisis histórico de 200 días sobre el número de consultas diarias realizadas a un sistema de información empresarial (EIS) residente en un servidor central. La tabla incluye el número de consultas diarias (0 a 5) junto con las frecuencias absolutas (número de días que se producen 0, 1, ..., 5 consultas), las frecuencias relativas (10/200 = 0,05, ...), y las frecuencias relativas acumuladas.







Podemos interpretar la frecuencia relativa como la probabilidad de que ocurra el suceso asociado, en este caso, la probabilidad de un determinado número de consultas (así, p.e., la probabilidad de que se den 3 consultas en un día sería de 0,30), por lo que la tabla anterior nos proporciona la distribución de probabilidad 7 asociada a una variable aleatoria discreta (la variable aleatoria es el número de consultas al EIS, que sólo puede tomar valores enteros entre 0 y 5). Supongamos que queremos conocer el número esperado (o medio) de consultas por día. La respuesta a esta pregunta es fácil si recurrimos a la teoría de la probabilidad: Denotando por X a la variable aleatoria que representa el número diario de consultas al EIS, sabemos que:





Por otra parte, también podemos usar simulación de Monte Carlo para estimar el número esperado de consultas diarias (en este caso se ha podido obtener el valor exacto usando teoría de probabilidad, pero ello no siempre será factible). Veamos cómo: Cuando se conozca la distribución de probabilidad asociada a una variable aleatoria discreta, será posible usar la columna de frecuencias relativas acumuladas para obtener los llamados intervalos de números aleatorios asociados a cada suceso. En este caso, los intervalos obtenidos son:
• [0,00 , 0,05) para el suceso 0
• [0,05 , 0,15) para el suceso 1
• [0,15 , 0,35) para el suceso 2
• [0,35 , 0,65) para el suceso 3
• [0,65 , 0,85) para el suceso 4
• [0,85 , 1,00) para el suceso 5


El gráfico siguiente nos muestra cada una de las probabilidades sobre el número de consultas. En él, se aprecia claramente la relación existente entre probabilidad de cada suceso y el área que éste ocupa.







Esto significa que, al generar un número pseudo-aleatorio con el ordenador (proveniente de una distribución uniforme entre 0 y 1), estaremos llevando a cabo un experimento cuyo resultado, obtenido de forma aleatoria y según la distribución de probabilidad anterior, estará asociado a un suceso. Así por ejemplo, si el ordenador nos proporciona el número pseudo-aleatorio 0,2567, podremos suponer que ese día se han producido 2 consultas al EIS. Asignamos pues la función ALEATORIO a una casilla (la G1 en el caso de la imagen):







A continuación, podemos usar la función SI de Excel para asignar un suceso a cada uno de los números pseudo-aleatorios generados (como veremos, otra forma de hacer esta asignación será usando la función BUSCARV):







Repitiendo el proceso de seleccionar y “arrastrar” obtendremos algo similar a:








Finalmente, usando la función PROMEDIO será posible calcular la media de los valores de la columna H:








En este caso, hemos obtenido un valor estimado que corresponde exactamente con el valor real anteriormente calculado vía la definición teórica de la media. Sin embargo, debido a la componente aleatoria intrínseca al modelo, normalmente obtendremos valores “cercanos” al valor real, siendo dichos valores diferentes unos de otros (cada simulación proporcionará sus propios resultados). Se puede comprobar este hecho pulsando repetidamente sobre la función F9 (cada vez que se pulsa dicha tecla, Excel genera nuevos valores aleatorios y, por tanto, nuevos valores para la columna H y la casilla I1). Si en lugar de usar una muestra aleatoria formada por 100 observaciones hubiésemos usado una formada por 10, los valores que obtendríamos al pulsar repetidamente F9 no serían estimaciones tan buenas al valor real. Por el contrario, es de esperar que si hubiésemos usado 1.000 (o mejor aún 10.000) observaciones, los valores que obtendríamos en la casilla I1 estarían todos muy cercanos al valor real.

3.3 Definiciones: Replica, corrida, estado transitorio, estado estable, condiciones iniciales, reloj de la simulación

REPLICA: Las réplicas son múltiples corridas experimentales con la misma configuración de factores (niveles). Las réplicas están sujetas a l...