¿Qué es la Conferencia Stata México ?

Es un espacio internacional donde los temas más relevantes e innovadores en Econometría y Estadística se discuten en las conferencias magistrales, así como en presentaciones seleccionadas por el Comité Científico que muestren una aplicación o desarrollo original de Stata.

Está dirigido a todos los usuarios e interesados de Stata que toman decisiones, empresarios, directores, jefes de departamento dedicados al mundo de los números y la estadística, así como a la comunidad estudiantil interesada en conocer herramientas novedosas y tecnológicas que fomenten su desarrollo profesional y laboral. Ray Goforth

En el Centro de Investigación en Alimentación y Desarrollo (CIAD)

Programa

Día 1

Día 2

9:20 – 9:40 a.m.

Un manual de herramientas sobre encuestas de gastos de los hogares para la investigación en la economía del control del tabaco utilizando Stata

Información adicional:   icon_

Carlos Guerrero L., John Rijo M., Violeta Vulovic, Grieve Chelwa, Frank Chaloupka - School of Public Health, University of Illinois Chicago

El consumo de tabaco sigue siendo uno de los principales factores de riesgo para desarrollar enfermedades no transmisibles (ENT), causando muerte prematura, discapacidad y costos económicos, lo que pone en peligro el desarrollo económico. Este manual de herramientas tiene como objetivo guiar a los investigadores interesados en estudiar la economía del control del tabaco, especialmente en países de ingresos bajos y medios, como México. Presenta antecedentes teóricos sobre la economía del tabaco y proporciona herramientas paso a paso desarrolladas en Stata para estimar las elasticidades propias y cruzadas de los precios de los productos de tabaco, y los efectos de desplazamiento y empobrecimiento mediante encuestas de gastos de los hogares (HES). Se ocupa de problemas estándar con HES y proporciona consejos para la gestión y el análisis de datos en Stata. Estas evaluaciones son insumos básicos para diseñar mejores políticas fiscales, que son las medidas más efectivas para reducir el consumo de tabaco. Las herramientas incluidas también podrían aplicarse a otros productos nocivos, como las bebidas alcohólicas o endulzadas con azúcar, que también son factores de riesgo importantes para las ENT. En el kit de herramientas también se proporcionan estudios de casos de países de ingresos bajos y medios que implementan archivos de Stata ad hoc y replicables.

A toolkit on Household Expenditure Surveys for Research in the Economics of Tobacco Control using Stata

Tobacco use remains as one of the main risk factors for developing noncommunicable diseases (NCDs), causing premature death, disability, and economic costs, which jeopardizes economic development. This toolkit aims to guide researchers interested in investigating the economics of tobacco control, especially in low and middle-income countries, such as Mexico. It presents theoretical background on the economics of tobacco and provides step-by-step tools developed in Stata to estimate own and cross price elasticities of tobacco products, and the crowding-out and impoverishing effects using household expenditure surveys (HES). It deals with standard issues with HES and provides tips for data management and analysis in Stata. These assessments are basic inputs for designing better fiscal policies, which are the most effective measures to reduce tobacco use. The tools included could also be applied to other harmful products such as alcoholic or sugar-sweetened beverages, which are also major risk factors for NCDs. Case studies from low and middle-income countries implementing ad-hoc and replicable Stata do-files are also provided in the toolkit. The policy discussions and rationale of different economic concepts in tobacco control and interpretation of results could also benefit policy makers, analysts in government and civil society organizations engaged in tobacco control activities.

9:40 – 10:00 a.m.

Un análisis de la política ambiental global utilizando Stata

Información adicional:   icon_

Sergio Colin, Centro de Investigaciones Socioeconomicas, Universidad Autónoma de Coahuila

Aprovechando la facilidad que ofrece Stata en la rutina xtivreg y qregpd implementada por Sharma y Mishra (2022), este estudio analiza un grupo de países de la OCDE haciendo énfasis en México y la zona de Norteamérica. Se utilizan dos enfoques de la teoría económica: Neoclásico y evolucionista. Se utilizan dos modelos: panel de datos de efectos fijos (EF) con variables instrumentales (IV) y el modelo de cuantiles para panel de datos. La hipótesis de Porter (una mayor regulación ambiental propicia una mayor innovación y por ende una mayor competitividad) ha sido un tema controversial desde su aparición en los años noventa. Un gran número de estudios han tratado de probarla o refutarla con resultados distintos: dependiendo de factores como los datos disponibles, las variables, la metodología utilizada, y el nivel al que se hace el análisis (macro o micro). Se modela la secuencia donde la regulación ambiental influye primero en la innovación, y luego a la productividad; lidiando con la endogeneidad y posibles problemas de sesgo y asimetría. Utilizando la productividad total de los factores (TFP, por sus siglas en inglés) y el índice de rigurosidad ambiental EPS creado por la OCDE, en un periodo de 20 años, los resultados muestran evidencia a favor de Porter.

An analysis of global environmental policy using Stata

Taking advantage of the ease offered by Stata in the xtivreg and qregpd routine implemented by Sharma and Mishra (2022), this study analyzes a group of OECD countries with emphasis on Mexico and North America. Two approaches to economic theory are used: Neoclassical and evolutionary. Two models are used: fixed-effect data panel (PE) with instrumental variables (IV) and the quantile model for data panel. Porter's hypothesis (greater environmental regulation leads to greater innovation and therefore greater competitiveness) has been a controversial topic since its appearance in the nineties. Studies have tried to prove or disprove it with different results: depending on factors such as the available data, the variables, the methodology used, and the level at which the analysis is done (macro or micro). The sequence where environmental regulation influences first innovation, and then productivity deals with endogeneity and possible problems of bias and asymmetry. By using total factor productivity (TFP) and the EPS environmental stringency index created by the OECD, over a 20-year period the results show evidence in favor of Porter.

10:00 – 10:20 a.m.

Aplicación de un índice de concentración de exportaciones en los estados de México y Estados Unidos de América usando Stata

Información adicional:   icon_

Dora Haydee Valenzuela Miranda, Arturo Robles Valencia, Dpto. de Economía, Universidad de Sonora.

La relación comercial de México y Estados Unidos es de gran importancia a nivel internacional, se encuentra formalizada desde 1994 por el Tratado de Libre Comercio de América del Norte (TLCAN), ahora conocido como Tratado México, Estados Unidos y Canadá (T-MEC). Al entrar en vigor dicho tratado, el volumen del comercio ha crecido considerablemente entre los socios de América del Norte, ya que este busco fortalecer la relación económico de estas naciones. Sin embargo, algunos países presentan una concentración comercial alta dado a las exportaciones e importaciones ejecutadas entre países para satisfacer las demandas de sus socios comerciales.
Aplicando una metodología de cálculo con el Índice de Herfindahl-Hirschmann (IHH) (Ansari, 2012) empleando la versión del comando ‘hhi5’ propuesto por Yujun, Lian (2016) e índices de concentración de las exportaciones de México y Estado Unidos de América, para realizar un análisis de exportaciones en los estados de los países mencionados, con el fin de identificar la posición de los estados claves para el comercio transfronterizo por corredores comerciales establecidos por el T-MEC, donde se mueve el 70% del comercio de América del Norte. Siendo los corredores más importantes: el Corredor de la Costa Oeste, el Corredor Canamex y el Corredor de la Supercarretera América del Norte.

An application of a concentration index with STATA: Exports in the states of Mexico and the United States using Stata

The commercial relationship between Mexico and the United States of America is of great importance at the international level, it has been formalized since 1994 by the North American Free Trade Agreement (NAFTA), now replaced by the United States - Mexico-Canada Agreement (USMCA). When the USMCA entered into force, the volume of trade has grown considerably between the North American partners, since its ought to strengthen the economic relationship of these nations. However, some countries present a high commercial concentration due to the exports and imports carried out between countries to satisfy the demands of the commercial partners. By using STATA the Herfindahl-Hirschmann Index (IHH) is computed (Ansari, 2012) with the command version ‘hhi5’ by Yujun, Lian (2016) and concentration indexes of exports from Mexico and the United States of America, to perform an analysis of exports in the states of the mentioned countries, with in order to identify the position of the key states for cross-border trade through commercial corridors established by the USMCA Agreement, where 70% of North American trade moves. The most important corridors are: the West Coast Corridor, the Canamex Corridor, and the North American Superhighway Corridor.

10:20 – 11:20 a.m.

Introduction a la estimación con el promedio de modelos Bayesianos en Stata

Información adicional:   icon_

Gustavo Sanchez - Director of Technical Services at StataCorp

La selección del modelo representa un aspecto clave en el análisis de regresión. La mayoría de las aplicaciones empíricas consideran un modelo de generación de datos (DGM) subyacente desconocido y fijo que los investigadores intentan encontrar, en función de un marco teórico particular que se combina con los datos asociados a las variables involucradas en la especificación seleccionada para ese modelo. El promedio de modelos bayesianos proporciona un enfoque en el que, en lugar de centrar la estimación en la búsqueda de ese modelo único desconocido, los investigadores pueden incorporar la incertidumbre sobre el DMG para obtener probabilidades asociadas a predictores relevantes, mediciones sobre predictores complementarios o sustituibles en diferentes posibles modelos, y también predicciones que incorporan la incertidumbre acerca del modelo y sus parámetros. En esta presentación, utilizaremos el nuevo conjunto de comandos bma para ilustrar los aspectos mencionados en el párrafo anterior, y otras respuestas que se pueden derivar del promedio de modelos bayesianos.

Introduction to Bayesian model averaging in Stata

Model selection represents a key aspect in regression analysis. Most empirical applications consider a fixed unknown underlying data-generating model (DGM) that researchers try to find, based on a particular theoretical framework that is combined with the data associated with the variables involved in the selected model specification. Bayesian model averaging provides an approach where instead of focusing the estimation on the search for that unique unknown model, researchers can incorporate the uncertainty about the DMG to obtain probabilities associated with relevant predictors, measurements about complementary or substitutable predictors across different model candidates, and also predictions that incorporate uncertainty about the model and the parameters. In this presentation, we will use the new suite of bma commands to illustrate those and other aspects that can be derived using Bayesian model averaging.

11:20–11:40 a.m.

Coffee Break

11:40 – 12:40 p.m.

* * Conferencia Magistral * *

Marginal odds ratios: What they are, how to compute them, and why we might want to use them

Información adicional:   icon_

Ben Jann, University of Bern, Suiza
12:40 – 1:40 p.m.

Lunch

1:40 – 2:00 p.m.

Comandos clorenz, cdensity y digini y su aplicación en el análisis de la distribución del ingreso

Información adicional:   icon_

Linda Llamas, Universidad Estatal de Sonora

Se muestran herramientas para el análisis de la distribución del ingreso a través de los comandos integrados en el módulo DASP (Distributive Analysis Stata Package) que operan en ambiente Stata. Los comandos de DASP ofrecen vías cortas de estimaciones y de elaboración de material gráfico para analizar la desigualdad económica. La presentación se centra en los comandos clorenz, cdensity, igini y digini, los cuales están programados como ado-files en Stata; además, se muestran ejemplos de su aplicación para bases microsimuladas con la Encuesta de Ingresos y Gastos de los Hogares (ENIGH), 2020. Los ejercicios comparan el conjunto de sintaxis con un lenguaje de cálculo normal, necesarios para el cálculo de la desigualdad, curvas de lorenz y curvas de densidad, y de manera paralela, se replican los resultados con los comandos de DASP mencionados.

Comandos clorenz, cdensity and digini commands and their application in the analysis of income distribution

Tools for the analysis of income distribution are shown through the commands integrated in the module Distributive Analysis Stata Package (DASP) that operate in Stata. DASP commands provide short avenues for estimating and producing graphic material to analyze easily economic inequality. The presentation focuses on the clorenz, cdensity, igini and digini commands, which are programmed as ado-files; in addition, examples of its application by using microsimulated databases are shown through the Household Income and Expenditure Survey (ENIGH), 2020. The exercises compare the set of syntax with standard calculation Stata language, necessary for the calculation of inequality, Lorenz curves and kernel density curves, and in parallel, the output is replicated with the DASP commands mentioned.

2:00 – 2:20 p.m.

La descomposición del alfabetismo financiero: Un análisis multinomial

Información adicional:   icon_

Javier Martínez Martínez, Universidad Autónoma de Chihuahua

Este trabajo tiene como objetivo calcular y discutir la descomposición del índice del alfabetismo financiero como una alternativa para estimar probabilidades de baja y alta alfabetización financiera de los integrantes de los hogares, en México, con base en sus características sociodemográficas y de finanzas personales. La elaboración del índice se basó en el manual para la medición de la educación e inclusión financiera propuesto por la OCDE/INFE y 14 preguntas de la ENIF, mientras que, para calcular la descomposición se usaron comandos específicos de Stata. Para estimar la alta y baja probabilidad se generó un modelo probabilístico multinomial ordenado tipo probit. Los datos se obtuvieron de las cuatro bases de microdatos de la Encuesta Nacional de Inclusión Financiera (ENIF) 2021, publicada por el INEGI. Los resultados obtenidos verifican que la desigualdad del alfabetismo financiero es consecuencia de un problema de estructura social lo que conlleva a un nuevo aporte a la evidencia empírica. Finalmente, este tipo de ejercicios, a través de Stata, permiten argumentar nuevas formas de crear y evaluar variables más eficientes para la estimación de modelos econométricos.

The Decomposition of Financial Literacy: A Multinomial Analysis

This study aims to calculate and discuss the decomposition of the financial literacy index as an alternative to estimate the probabilities of low and high financial literacy among household members in Mexico, based on their sociodemographic and personal finance characteristics. The construction of the index was based on the manual for measuring education and financial inclusion proposed by the OECD/INFE and 14 questions from the ENIF (National Survey of Financial Inclusion), while specific Stata commands were used to calculate the decomposition. To estimate high and low probabilities, an ordered multinomial probit probabilistic model was generated. The data was obtained from the four microdata sources of the 2021 National Survey of Financial Inclusion (ENIF), published by INEGI (National Institute of Statistics and Geography). The results obtained confirm that the inequality in financial literacy is a consequence of a social structure problem, which contributes to new empirical evidence. Finally, exercises of this nature, using Stata, allow for the argumentation of new ways to create and evaluate more efficient variables for econometric model estimation.

2:20 – 2:40 p.m.

Violencia de pareja, tendencias y factores asociados: Encuestas Nacionales de Salud en México, 2011 y 2016

Información adicional:   icon_

Paola Adanari Ortega, Luz Myriam Reynales, Leonor Rivera, y Luis Zavala, Universidad Autónoma del Estado de Morelos / Instituto Nacional de Salud Pública

La tendencia de la prevalencia de violencia de pareja (VP) en muestras representativas es escasa. El objetivo de este trabajo es analizar la tendencia de la prevalencia de VP en hombres y mujeres e identificar los factores asociados en México. Los datos provienen de la Encuesta Nacional de Adicciones 2011 y la Encuesta Nacional de Consumo de Drogas, Alcohol y Tabaco 2016 se seleccionó una muestra de 44,963 individuos. Se estimaron modelos Poisson con STATA y los resultados muestran que la prevalencia de VP fue de 15.58% en 2011 y 14.90% en 2016. Los factores asociados fueron ser mujer (RR=1.09, IC95%0.99-1.19), consumo de alcohol de la pareja (RR=1.68, CI95% 1.54-1.84) y consumo de drogas de la pareja (RR=2.80, CI95% 2.46-3.18). La situación conyugal de soltero con (RR=0.66, CI 95% 0.56-0.78); tener parejas anteriores (RR=0.60, CI 95% 0.55-0.66); y más años de convivencia con la pareja (RR=1.81, CI 95% (1.47-2.23), vivir en zona urbana (RR=1.18, CI 95% 1.05-1.33). Los resultados indican en México que la prevalencia de VP ha disminuido principalmente en la población que tiene un mejor ingreso económico familiar. Los factores asociados a VP son similares en ambos sexos por lo que las acciones encaminadas a prevenir este problema deben incluir a hombres y a mujeres.

Intimate partner violence, trends and associated factors: National Health Surveys in Mexico, 2011 and 2016

The tendency of the prevalence of partner violence (VP) in representative samples is scarce. The objective is to analyze the trend of the prevalence of VP in men and women and identify the associated factors in Mexico. The data used come from the National Survey of Addictions 2011 and the National Survey of Drug, Alcohol and Tobacco Consumption 2016, a sample of 44,963 individuals was selected. By using Poisson models with STATA, we show that prevalence of PV was 15.58% in 2011 and 14.90% in 2016. The associated factors were being a woman (RR=1.09, IC95%0.99-1.19), alcohol consumption by the partner (RR=1.68, CI95% 1.54 -1.84) and drug use by the partner (RR=2.80, CI95% 2.46-3.18). Single marital status (RR=0.66, 95% CI 0.56-0.78); having previous partners (RR=0.60, 95% CI 0.55-0.66); more years of living with a partner (RR=1.81, 95% CI (1.47-2.23), living in an urban area (RR=1.18, 95% CI 1.05-1.33). Main conclusions display how prevalence of IPV has decreased mainly in the population that has higher family income. Factors associated with VP are similar in both sexes, so actions aimed at preventing this problem should include men and women.

2:40 – 3:00 p.m.

Coffee Break

3:00 – 3:20 p.m.

Modelos de regresión quasi-poisson y su aplicación en estudios de campo con datos provenientes de conteos entomológicos

Información adicional:   icon_

Ricardo Vazquez, Julián Esparza, Kacey Ernst, Maricela Montalvo, Centro de Investigación en Alimentación y Desarrollo, CIAD

El trabajo con datos provenientes de conteos entomológicos y su uso en un modelo de regresión implica decidir sobre qué modelo es más apto para su análisis. Existen modelos lineales generalizados mixtos, donde se incluyen los modelos de poisson y sus variantes. El uso de la variante quasi-poisson es sumamente atractiva cuando hay sobredispersión en la distribución de los datos, ya que permite generar modelos de asociación en función de la distribución de poisson. En este trabajo se presentan los criterios y procedimientos para la elección y generación de un modelo quasi-poisson en Stata, usando como ejemplo un modelo de asociación con datos provenientes de un estudio de vigilancia entomoviral.

Quasi-poisson regression models in Stata and their application in field studies with data from entomological counts

Working with data from entomological counts and their use in a regression model involves deciding which model is best suited for analysis. There are generalized mixed linear models, which include the poisson models and their variants. The use of the quasi-poisson variant is extremely attractive when there is overdispersion in the distribution of the data, since it allows to generate association models based on the poisson distribution. This paper presents the criteria and procedures for the choice and generation of a quasi-poisson model in STATA, using as an example an association model with data from an entomoviral surveillance study.

3:20 – 3:40 p.m.

Análisis de texto para identificar las modificaciones de profesores universitarios en la enseñanza de la estadística debido al COVID-19

Información adicional:   icon_

José G. Rivera, Ana Luisa Gómez - Insituto Politécnico Nacional / CICATA - Legaria

En el contexto de una investigación en el campo de la educación matemática, se realizó un estudio nacional para identificar características de la enseñanza y evaluación de la estadística por parte de profesores que enseñan estadística en carreras universitarias. Para ello, se diseñó una encuesta con 76 preguntas, entre las cuales se incluyó la pregunta abierta: A raíz de la contingencia sanitaria del COVID-19, ¿cómo ha modificado su enseñanza? La encuesta fue respondida por 750 profesores, de los cuales 627 respondieron a la pregunta. Se expone el método de análisis que se aplicó usando Stata v.17 para analizar las 627 respuestas. Se realizó un análisis de coincidencias, el cual, es una técnica de investigación que consiste en analizar textos, documentos o respuestas mediante la extracción de palabras clave con la finalidad de obtener información estructurada e identificar posibles patrones de respuesta. Se utilizaron las herramientas de análisis de texto (txttool, precoin y coin) para identificar las palabras más frecuentes y posibles relaciones entre ellas. La implementación de estas herramientas permitió obtener información de las modificaciones que realizó el profesor de estadística en su enseñanza debido a la contingencia sanitaria del COVID-19.

Text analysis to identify modifications of university professors in teaching statistics due to COVID-19

In the context of research in mathematics education, a national study was carried out to identify characteristics of the teaching and evaluation of statistics by professors who teach statistics in university courses. For this purpose, a survey was designed with 76 questions, including the open-ended question: As a result of the COVID-19 health contingency, how has your teaching changed? The survey was answered by 750 professors, of whom 627 responded to the question. We present the analysis method applied with Stata v.17 to analyze the 627 responses. Coincidence analysis was performed, a research technique that analyzes texts, documents, or responses by extracting keywords to obtain structured information and identify possible response patterns. Text analysis tools (txttool, precoin and coin) were used to identify the most frequent words and possible relationships between them. Implementing these tools made it possible to obtain information on the modifications made by the statistics professor in his teaching due to the COVID-19 health contingency.

3:40 – 4:00 p.m.

Análisis del consumo de alimentos ultraprocesados y su relación con la grasa corporal en adolescentes empleando regresión lineal múltiple en Stata

Información adicional:   icon_

C. Robles Aguilar, R. Terminel Zaragoza, Julián Esparza R., F. Legarreta Muela, R. Ulloa Mercado, A. Serna Gutiérrez, L. Díaz Tenorio, A. Rentería Mexía - Instituto Tecnológico de Sonora

En la presente investigación se empleó la regresión lineal múltiple para analizar la asociación entre la variable respuesta de grasa corporal con el consumo de alimentos procesados clasificados según su procesamiento acorde al sistema NOVA, ajustado por otras variables predictoras, en adolescentes universitarios del sur de Sonora. El modelo de ajuste se obtuvo a partir de un conjunto de variables del estilo de vida, además de los alimentos procesados, como actividad física, tabaquismo y antecedentes familiares de enfermedad cardiometabólica. El modelo de ajuste se generó con el programa Stata, mediante una serie de etapas, iniciando con un análisis exploratorio, seguido de una análisis Univariado y finalizando con el uso de stepwise. El modelo final se evaluó por interacción, colinealidad y supuestos de la regresión lineal. Se analizaron datos de 230 adolescentes universitarios inscritos en el Instituto Tecnológico de Sonora (ITSON).

Analysis of ultra-processed food intake and its relationship with body fat in adolescents using multiple linear regression in Stata

Multiple regression analysis was used to examine the relationship between body fat percentage and the consumption of ultra-processed foods, classified according to the NOVA system and adjusted for other predictor variables, in freshman university adolescents. The adjustment model was developed using a variety of lifestyle factors, such as physical activity, tobacco use, and family history of cardiovascular disease, in addition to ultra-processed food variables. The adjustment model was created using the STATA software through a series of steps, beginning with exploratory analysis, moving on to univariate analysis, and concluding with stepwise analysis. The resultant model was assessed for interaction, multi-collinearity, and linear regression hypotheses. Data from 230 freshman university students enrolled at the Instituto Tecnológico de Sonora (ITSON) were examined.

4:00 – 4:20 p.m.

El Stata como herramienta colaborativa

Información adicional:   icon_

Ricardo Cantú - Centro de Investigación Economica y Presupuestaría A.C. CIEP

Se presentan un conjunto de do y ado-files que permiten un análisis sistemático de indicadores económicos tales como los ingresos, gastos y deuda pública en México sobre su sistema fiscal y sostenibilidad de largo plazo con Stata. Se importan automáticamente datos actualizados de diversas fuentes, como las Estadísticas Oportunas de la Secretaría de Hacienda (e.g. import delimited https://...), el Banco de Información Económica del Instituto de Estadística (INEGI) y de los Censos y encuestas de los hogares. Después de limpiar y guardar las bases de datos (sysdir_site) en un "hosting" de un simulador fiscal se elabora un archivo sysprofile.do para vincular todos los programas Stata en oficina a la carpeta compartida. Ello permite acceder a 78 do- y ado-files programados así como a bases de datos pre-procesadas. Con ello se puede solicitar fácilmente ingresos, egresos, financiamiento y endeudamiento específicos para un año determinado y conceptos deseados de manera coordinada. Además, se presenta un comando interno para integrar automáticamente valores de Stata en documentos de LaTeX, lo cual facilita la generación de informes y documentos con información precisa y actualizada.

Stata as a collaborative tool

A set of do and ado-files are presented which allow a systematic analysis for economic indicators such as revenues, expenditures and public debt in Mexico on its fiscal system and long-term sustainability with Stata. Updated data are automatically imported from various sources, such as the Timely Statistics of the Ministry of Finance (e.g. import delimited https://...), the Economic Information System of the Institute of Statistics (INEGI) and the Censuses and household surveys. After cleaning and saving the databases (sysdir_site) in a "hosting" of a tax simulator, a sysprofile.do file is elaborated to link all the Stata programs in the office to a shared folder. This process allows access to 78 programmed do- and ado-files as well as pre-processed databases. With this, anyone can easily request income, expenditures, both financing and indebtedness specific to a given year and desired concepts in a coordinated work. In addition, an internal command is introduced to automatically integrate Stata values into LaTeX documents, which facilitates the generation of reports and documents with accurate and up-to-date information.

9:00 – 9:20 a.m.

Factores de riesgo asociados a diabetes mellitus gestacional en la región norte de México

Información adicional:   icon_

Humberto Martinez, Víctor Hugo Vazquez,Jesus III Loera, Juan David Camarillo - Centro de Investigación en Matemáticas, A.C (CIMAT)

El objetivo es determinar los factores de riesgo asociados a diabetes mellitus gestacional en el norte México usando un diseño observacional, analítico de casos y controles en una Unidad de Medicina Familiar No. 33 de Reynosa, Tamaulipas, México en mujeres embarazadas entre las 24 a 28 semanas de gestación. Las Intervenciones son a 363 casos y 587 controles que se les realizó la prueba de un paso con sobrecarga oral de 75 gramos de glucosa con determinación basal, a una hora y 2 horas para determinar la presencia o no de diabetes mellitus gestacional. A partir del expediente electrónico se recogieron variables sociodemográficas, antropométricas, gineco-obstétricas, antecedentes patológicos y no patológicos. La medición se realizó con Stata 17 con un análisis exploratorio univariado usando la media muestral y desviación estándar para conocer la centralidad y la dispersión. Posteriormente un análisis bivariado para determinar la asociación y la correlación de las variables de interés con la presencia o ausencia de diabetes gestacional. Por último, fue empleado un modelo logístico integral con los factores de estudio para determinar su efecto y significación estadística. Los resultados son que las mujeres con diabetes mellitus gestacional tienen mayor edad, peso y riesgo obstétrico y los principales factores de riesgo asociados a diabetes gestacional fueron la edad y la obesidad.

Risk factors associated with gestational diabetes in the northern region of Mexico

The objective is to determine the risk factors associated with gestational diabetes mellitus in northern Mexico using an observational, analytical design of cases and controls in a Family Medicine Unit No. 33 of Reynosa, Tamaulipas, Mexico in pregnant women between 24 and 28 weeks of gestation. The interventions are to 363 cases and 587 controls who underwent the one-step test with oral overload of 75 grams of glucose with baseline determination, at one hour and 2 hours to determine the presence or not of gestational diabetes mellitus. From the electronic file, sociodemographic, anthropometric, gynecoobstetric, pathological and non-pathological antecedents were collected. The measurement was performed with STATA 17 with a univariate exploratory analysis using the sample mean and standard deviation to determine the centrality and dispersion. Subsequently, a bivariate analysis was carried out to determine the association and correlation of the variables of interest with the presence or absence of gestational diabetes. Finally, a comprehensive logistic model with the study factors was used to determine their effect and statistical significance. The results are that women with gestational diabetes mellitus have greater age, weight and obstetric risk and the main risk factors associated with gestational diabetes were age and obesity.

9:20 – 9:40 a.m.

Modelos de regresión lineal múltiple y su aplicación en el análisis de variables cardiovasculares de universitarios del sur de Sonora

Información adicional:   icon_

A. Rentería Mexía, F. Legarreta Muela, Julián Esparza, R. Terminel Zaragoza, Toledo Domínguez, Quinero Portillo H., Ulloa Mercado R., Gortáres Moroyoqui P., Meza Escalante E. - Instuto Tecnológico de Sonora

Modelos de regresión lineal múltiple y su aplicación en el análisis de variables cardiovasculares de universitarios del sur de Sonora. La regresión lineal múltiple es una de las más importantes técnicas estadísticas empleadas en epidemióloga de la nutrición para analizar el efecto predictor de variables de exposición sobre una variable respuesta, que deber ser cuantitativa. Las variables identificadas con potencial de ser modificables pueden a su vez ser empleadas en programas preventivos. La presente investigación tuvo como objetivo analizar la asociación entre variables de comportamiento relacionadas con la salud cardiovascular con indicadores antropométricos de obesidad en universitarios de nuevo ingreso al Instituto Tecnológico de Sonora. La variable respuesta fue grasa corporal y las variables predictoras fueron grupos de alimentos y nutrimentos y actividad física acordes al criterio de la American Heart Association. Se utilizaron análisis de asociación potencial y se construyeron modelos múltiples mediante selección por pasos (stepwise forward) (p≤0.05 y plausibilidad biológica) con datos de 230 adolescentes universitarios a través del software Stata.

Multiple linear regression models and their application in the analysis of cardiovascular variables in university students from Southern Sonora

Multiple linear regression is one of the most important statistical techniques used in nutrition epidemiology to analyze the predictive effect of exposure variables on a response variable, which should be quantitative. Variables identified with the potential to be modifiable can in turn be used in preventive programs. The objective of this research was to analyze the association between behavioral variables related to cardiovascular health with anthropometric indicators of obesity in freshman university students enrolled at the Technological Institute of Sonora. The response variable was body fat and the predictor variables were food and nutrient groups and physical activity, according to the criteria of the American Heart Association. Potential association analyzes were used and multiple models were built by stepwise forward selection (p≤0.05 and biological plausibility) with data from 230 university adolescents using the Stata software.

9:40 – 10:00 a.m.

Análisis de datos complejos mediante el comando SVY en Stata

Información adicional:   icon_

Norma A. Dórame, Araceli Serna, Alejandro A. Castro, Ana C. Gallegos, Julián Esparza R. - Centro de Investigación en Alimentación y Desarrollo, CIAD

La presentación aborda el diseño probabilístico polietápico de un estudio tipo encuesta, del cual se obtuvieron datos complejos, que posteriormente se analizaron mediante el módulo SVY contenido en el paquete estadístico Stata 16. El análisis consideró las variables de diseño necesarias para el adecuado manejo de la información. A través del comando SVY se estimó la prevalencia de diagnóstico previo de diabetes tipo 2 (DPDT2) en una muestra representativa de adultos indígenas yaquis (n=351), habitantes de los pueblos tradicionales de la etnia en el estado de Sonora. Del mismo modo se calcularon las medias y proporciones de los posibles factores asociados al DPDT2 y se conoció el número de individuos del grupo indígena que presentan la variable de interés.

Analysis of complex data using the SVY command in Stata

The presentation deals with the multistage probabilistic design of a survey research, from which complex data was obtained, and subsequently analyzed using the SVY module contained in the statistical package Stata 16. The analysis considered the design variables necessary for the adequate handling of the information. Using the SVY command, the prevalence of previous diagnosis of type 2 diabetes (PDT2D) was estimated in a representative sample of Yaqui indigenous adults (n=351), inhabitants of the traditional towns of the ethnic group in Sonora. In the same way, the means and proportions of the possible factors associated with PDT2D were calculated and the number of individuals of the indigenous group that presented the variable of interest was known.

10:00 – 10:20 a.m.

Elementos para el análisis de los niveles de plomo en sangre en muestras poblacionales

Información adicional:   icon_

María Alejandra, Terrazas Meraz, Paola A. Ortega, Margarita de Lorena Ramos, Ofmara Y. Zúñiga, Gabriela E. Rueda - Universidad Autónoma del Estado de México

La intoxicación por plomo es un problema de salud pública ampliamente estudiado en México. Los métodos para determinar los niveles de plomo en sangre buscan encontrar la concentración cuantitativa en ug/dL de sangre de plomo, que al trabajarla en muestras poblacionales difícilmente tendrá una distribución normal. Reflexionamos en tres formas de analizar los niveles de plomo en sangre al describir las diferencias y logros de cada tipo de análisis utilizando el programa Stata a partir de los datos abiertos de la Encuesta Nacional de Salud y Nutrición (ENSANUT) 2018. El estudio consiste en un análisis transversal de las muestras de sangre capilar obtenidas en la encuesta, medidas en ug/dL de sangre, con tres maneras de procesamiento estadístico: con la transformación logarítmica para el análisis con regresión lineal, al analizar los datos obtenidos naturalmente con regresión robusta y el análisis categórico con los puntos de corte referidos en la normatividad internacional con regresión logística; se compararon los modelos multivariados con las mismas variables de ajuste. Para la elección del análisis multivariado se concluye que las estrategias de análisis se eligen no solo por ser novedosas sino para mantener una consistencia en los resultados de los estudios que sean comparables internacionalmente.

Elements for the analysis of blood lead levels in population samples

Lead poisoning is a widely studied public health problem in Mexico. Methods to determine blood lead levels seek to find the quantitative concentration in ug/dL of blood lead, that when statistically analyzed on population samples rarely seen with normal distribution. We will discuss three ways to analyze blood lead levels by describing the differences and achievements of each type of analysis, using Stata and the National Survey of Health and Nutrition (ENSANUT) 2018 open data. The study consists of a cross-sectional analysis of the capillary blood samples obtained in the survey, measured in ug/dL of blood, with three ways of statistical processing: with the logarithmic transformation for the analysis with linear regression, when analyzing the data obtained naturally with robust regression and categorical analysis with cut-off points referred to in international regulations with logistic regression; multivariate models were compared with the same adjustment variables. The strategies for the selection of the multivariate analysis are made not only because they are new or novel but also to maintain consistency with the results of other studies that are internationally comparable.

10:20 – 11:20 a.m.

Heterogeneous difference-in-difference estimation

Información adicional:   icon_

Eduardo Garcia Echeverri - Senior Econometrician at StataCorp

Treatment-effects may be different for groups that are treated in different time periods or may change over time after a group has been treated. Think about, for example, the effect of job training programs on earnings or the effectiveness of COVID vaccines. To capture this heterogeneity, Stata 18 introduces two commands that estimate treatment-effects specific to each cohort and time period. For repeated cross-sectional data, we have hdidregress. For panel data, we have xthdidregress. Both commands let you aggregate treatment-effects by cohort and exposure to treatment, and visualize these effects graphically. Tests of pre-treatment parallel trends are also available. This presentation will illustrate how both commands work and briefly discuss the theory underlying them.

El efecto de un tratamiento puede variar entre grupos que han sido tratados en distintos periodos de tiempo o puede también cambiar con el tiempo después de que un grupo ha sido tratado. Por ejemplo, esto puede ocurrir cuando se estudia el efecto de un programa de capacitación laboral sobre los ingresos o cuando se estudia la efectividad de las vacunas contra el COVID. Para estudiar esta heterogeneidad más a fondo, Stata 18 introdujo dos nuevos comandos que estiman el efecto del tratamiento específicamente para cada cohorte y periodo de tiempo. Para datos de repeated cross-section, tenemos hdidregress. Para datos panel, tenemos xthdidregress. Ambos comandos permiten agregar los efectos del tratamiento por cohorte y exposición al tratamiento, además permiten visualizar estos efectos gráficamente. Pruebas estadísticas para determinar si las trayectorias previas al tratamiento son paralelas, también están disponibles. Esta presentación ilustra cómo utilizar ambos comandos y discute brevemente la teoría detrás de éstos.

11:20 – 11:40 a.m.

Coffee Break

11:40 a.m. – 12:40 p.m.

* * Conferencia Magistral * *

Análisis de componentes principales con STATA: Su uso en la generación de patrones dietarios

Información adicional:   icon_

Dr. Julián Esparza Romero - Unidad de Investigación en Obesidad y Diabetes, CIAD

12:40 – 1:40 p.m.

Lunch

1:40 – 2:00 p.m.

Gestión de datos en encuestas de ingresos y gastos de los hogares: Análisis con familias extendidas usando Stata

Información adicional:   icon_

Luis Huesca, Enrique Labrada - Centro de Investigación en Alimentación y Desarrollo y Universidad Autnoma de Baja California

Con el fin de medir el efecto que podría tener algúna transferencia monetaria condicionada centrada en un individuo en una familia extendida (hogares de tres generaciones) evaluamos la efectividad del apoyo analizando los efectos que puede producir una transferencia relevante en México llamada Pensión para el bienestar de adultos mayores en cualquier otro miembro del hogar, como la preferencia por trabajar una menor cantidad de horas relacionadas con la edad de los miembros que trabajan en el hogar, así como cualquier posible aumento en la tasa de escolarización de los niños que viven en el hogar. Empleamos Stata para capturar los impactos transversales de esta política con un modelo Bayesiano de regresión probit con selección de muestras mediante el uso de datos microsimulados con MEXMOD alimentados con la Encuesta Nacional de Ingresos y Gastos de los Hogares en 2014 y 2020 (ENIGH).

Data management in household income and expenditure surveys: Working with extended families using Stata

In order to measure the effect that some mean-tested benefit focused on one individual member of an extended family (three generation households) could have we evaluate the program effectiveness by analyzing the effects that can produce one relevant benefit in Mexico named Pensión para el bienestar de adultos mayores on any other member of the household, such as the preference for working less with fewer number of hours related to the age of the household occupied members. We employ Stata to capture the cross-section impacts of this policy with a Bayesian Probit Regression model with Sample Selection (BPSS) by using microsimulated data from MEXMOD fed with Encuesta Nacional de Ingresos y Gastos de los Hogares in 2014 and 2020 (ENIGH).

2:00 – 2:20 p.m.

Mapeo de los efectos de contagio regionales en México a partir de la autorregresión espacial utilizando Stata

Juan F. Islas, Janeth Y. Rodríguez - Insituto Politécnico Nacional, IPN

Discutimos la tipología Anselin (1988, 2005) para explorar la dependencia espacial de los datos y confirmar los efectos espaciales, las matrices de ponderación espacial de contigüidad y la descomposición del impacto para los estados y municipios mexicanos. Dos ejemplos de efectos secundarios microeconómicos regionales son de nuestro interés: i) cambios 2010-2022 en la matrícula y graduados en educación superior en ciencias sociales con conjunto de datos de la Asociación Nacional de Universidades y de Institutos de Estudios Superiores (ANUIES), ii) 2005-2022 Con distribuciones de tipo Mincer y los rendimientos a la escolaridad con microdatos de la Encuesta Nacional de Ocupación (ENOE) INEGI. La sintaxis, los resultados matriciales y las plantillas que se presentan muestran la versatilidad de Stata y Mata como una herramienta ideal en la gestión y análisis de grandes volúmenes de datos con un enfoque en el análisis estadístico y econométrico con estrategias basadas en el aprendizaje y la enseñanza que requieren el uso de información real y reciente para ser replicadas, resumidas y analizada con algoritmos, procedimientos y código estructurado.

Mapping regional spillover effects in México from spatial autoregression using Stata

We discuss the Anselin (1988, 2005) typology to explore the spatial dependency of the data and confirm the spatial effects, contiguity spatial weighting matrices and impact decomposition for Mexican states and municipalities. Two examples of regional microeconomic spillovers are our interest: i) 2010-2022 changes in enrollment and graduated at higher education in social sciences with ANUIES dataset, ii) 2005-2022 Mincer schooling returns distribution with ENOE, INEGI microdata. The syntax, matrix results, and templates that are presented show the versatility of Stata and Mata as an ideal tool in the management and analysis of large volumes of data with a focus on statistical and econometric analysis with strategies based on learning and teaching that require the use of real and recent information to be replicated, summarized and analyzed with algorithms, procedures, and structured code.

2:20 – 2:40 p.m.

Coffee Break

2:40 – 3:10 p.m.

Open panel discussion with Stata developers

Contribuya a la comunidad de Stata compartiendo sus comentarios con los desarrolladores de StataCorp. Desde mejoras de funciones hasta correcciones de errores y nuevas formas de analizar datos, queremos saber cómo se puede mejorar Stata para nuestros usuarios.
3:10 – 3:30 p.m.

Regresiones, razones de cambio y prospecciones territoriales

David Juárez Castillo - Universidad Nacional Autónoma de México, Aragón

Durante 2023 y 2024 realizaremos una prospección de las condiciones de desarrollo del país para los años 2030,2040, 2050 y 2060, con base en los registros históricos de las variables físicas (humedad, temperatura, radiación solar, deforestación, entre otras) obtenidas de la Comisión Nacional del Agua, y de variables sociales (tasa de natalidad, densidad de población, nivel de estudios, entre otras) obtenidas de los censos de población. Dichas proyección se fundamentarán en cuatro momentos: 1. La obtención y el merge de bases de datos de distintas procedencias para construir una base de datos única con ambos tipos de variables. 2. A partir de generar regresiones entender el tipo y grado de correlación que establecen en un mismo modelo dichas variables. 3. Con los coeficientes de correlación, establecer proyecciones a nivel, país, estados, regiones en los estados y de ser posible hasta en niveles municipales. 4. Usaremos Stata para los pilotos del programa. Presentamos los resultados del piloto y su forma de hacerlos en Stata en la conferencia.

Regressions, change and territorial perspectives

During 2023 and 2024 we will carry out a survey of the development conditions of the country for the years 2030, 2040, 2050 and 2060, based on the historical records of the physical variables (humidity, temperature, solar radiation, deforestation, among others) obtained from the National Water Commission, and social variables (birth rate, population density, population, educational level, among others) obtained from population censuses. Said projection will be based on four moments: 1. Obtaining and merging bases of data from different sources to build a single database with both variable types. 2. From generating regressions to understand the type and degree of conclusions based on the same model for these variables. 3. With the coefficients of realization, establishment of projections at the level, country, states, regions in the states and if possible, even at municipal levels. 4. We will use Stata for the pilots of the program. We present the results of the pilot and his way of doing it in Stata at the conference.

3:30 – 3:50 p.m.

Actitudes discriminatorias y prejuicios en el mercado laboral mexicano: evidencia de viñetas experimentales

Información adicional:   icon_

Alfonso Miranda, Daniel Zizumbo, Adriana Aguilar, Jaime Sainz - Centro de Investigación y Docencia Ecocómicas-Aguascalientes, CIDE

En este trabajo utilizamos viñetas experimentales para estudiar cómo las características demográficas personales de un trabajador afectan la fijación de salarios y las decisiones de empleo entre el personal de una muestra aleatoria de empresas del sector de servicios de la Ciudad de México. Exploramos el efecto del sexo, el tono de la piel y el color del cabello, la simetría de la cara--- como un proxy de belleza o atractivo--- y el país de origen. Neto de una medida explícita de productividad, encontramos una penalización laboral discriminatoria del 11% de los trabajadores de América Central y del Sur, así como una costo discriminatorio para los trabajadores con caras asimétricas de 9% que está presente solo cuando los operativos toman decisiones de despido---cuando los gerentes toman decisiones de despido no hay "efecto belleza" presente. En cuanto a los salarios, encontramos evidencia débil de que a los migrantes de América Central y del Sur se les ofrecen salarios más bajos que a los trabajadores nativos en el mercado laboral mexicano. Finalmente, encontramos una fuerte evidencia de una penalización salarial sexual: a las mujeres se les ofrecen salarios que son aproximadamente un 6.6% más bajos que los ofrecidos a los hombres.

Discriminating attitudes and prejudices in the Mexican labour market: Evidence from experimental vignettes

In this paper we use experimental vignettes to study how a worker's personal demographic characteristics affect wage setting and employment decisions among the personnel of a random sample of Mexico City's service sector firms. We explore the effect of sex, skin tone and hair color, face symmetry---as a proxy for beauty or attractiveness---and country of origin. Net of a explicit productivity measure, we find a discriminatory employment penalty of 11% from Central and south America workers as well as a penalty for workers with asymmetric faces of $9\%$ that is present only when operatives take firing decisions---when managers take firing decisions no "beauty effect" is present. For wages, we find only weak evidence that migrants from Central and South America are offered lower wages than native workers in the Mexican labor market. Finally, we find strong evidence of a sex wage penalty: women are offered wages that are about 6.6% lower than those offered to men.

3:50 – 4:10 p.m.

Una aproximación metodológica de la aplicación del modelo de diferencias en diferencias en el gasto de alimentos con alto contenido energético

Información adicional:   icon_

Carlos Borbón, Juan Carlos Guimond - Centro de Investigación en Alimentación y Desarrollo, CIAD

El aumento de los problemas de salud derivados del consumo de alimentos con alto contenido energético, ha impulsado a que los gobiernos implementen políticas en salud pública, el sello frontal en productos alimenticios es una de ellas. El objetivo es evaluar el efecto de tal política en comunidades urbanas de México.
Metodología: Mediante el Stata, se manipularon los microdatos de la ENIGH. Se diseña do file, para sanear, clasificar y describir las variables. Se reclasifican los tipos de alimentos, construcción de deciles (xtile), de acuerdo a los atributos socioeconómicos. Se diseño un modelo de diferencia en diferencias, para aislar el efecto a nivel regional y temporal entre grupos de control y tratado. Con loops, se interaccionan cinco regiones y 19 productos seleccionados. Se verifican supuestos de MCO, mediante: VIF, estat imtest, estat hettest, sktest error, y swilk error, kdensity error, normal. Se reportan tablas y graficas mediante ssc install outreg2 Resultado: El etiquetado es efectivo para reducir el gasto de determinados alimentos ACE, es diferenciado dependiendo de la región, la localidad, el producto y el año.

A methodological approach to the application of the differences-in-differences model in the expenditure of foods with a high energy content

The increase in health problems derived from the consumption of foods with high caloric content has prompted governments to implement public health policies, with the frontal seal on food products as one of them. The objective is to evaluate the effect of such a policy in urban communities in Mexico through Stata, using microdata from the National Household Income and Expenditure Survey (ENIGH). A working dofile is shown to clean, classify and describe the variables, regrouping the types of food and by using deciles (xtile) according to socioeconomic attributes. A difference-in-differences econometric model is designed to isolate the effect at the regional and temporal levels between control and treatment groups. With loops, five regions and 19 selected products are interacted verifying MCO linearity assumptions through the tests: VIF, estat imtest, estat hettest, sktest error, and swilk error, kdensity error, normal. Tables and graphs edited with outreg2 command are reported and it is observed that labeling is effective in reducing the expenditure of certain foods and is differentiated according to the region, locality, product and year.

Comité Científico

Conoce a quienes seleccionaran las ponencias de la conferencia

Doctor en Economía y Maestro en Economía Aplicada por la Universidad Autónoma de Barcelona. Investigador titular D en el CIAD. Miembro del Sistema Nacional de Investigadores nivel 2. 1er lugar en el IX Premio Nacional a la Investigación Laboral 2006. Miembro activo del Grupo de Investigación en Políticas Públicas en la Universidad Laval de Québec, Canadá. Profesor de Econometría y estadística enseñando con el programa STATA.

Luis Huesca

CIAD

Alfonso Miranda

Doctor en economía por la Universidad de Warwick, Reino Unido. Profesor-investigador en la División de Economía del CIDE. Miembro del Sistema Nacional de Investigadores Nivel 3 y de la Academia Mexicana de Ciencias. Fue editor de la revista científica “Latin American Economic Review” y director del Programa de Estudios Longitudinales, Experimentos, y encuestas del CIDE. Investigador Asociado del Instituto para el Estudio del Trabajo (IZA), Alemania, y de la Organización Global del Trabajo (GLO).

Alfonso Miranda

CIDE

Julián Esparza

Maestro en Ciencias por el CIAD. Doctor en Epidemiología por la Mel and Enid Zuckerman College of Public Health, de la Universidad de Arizona. Investigador Titular “C”: Unidad de Investigación en Diabetes, Coordinación de Nutrición del CIAD. Titular del curso de regresión múltiple en la investigación epidemiológica. Premio nacional en investigación aplicada por la Fundación Mexicana para la Salud y Premio Estatal en Investigación de Salud en la modalidad de Salud Pública por la Secretaría de Salud en tres ocasiones. SNI Nivel II.

Julián Esparza

CIAD