Bienvenidos al Blog de TIcid


Presentación

Motivados por las permanentes consultas respecto a la elaboración de la tesis en estadística y la experiencia acumulada en el desarrollo de talleres de tesis, el equipo del TICiD desarrolla un espacio de discusión que permita alcanzar recomendaciones sobre cómo elaborar la tesis en el contexto de la ciencia de datos. Es importante destacar que nos centramos en el proyecto de tesis porque consideramos que éste es el último eslabón de un proceso que llamamos “mejoramiento de la idea de tesis”, a saber: exploración, concreción, planteamiento y delimitación.

De allí que, los artículos se organizarán siguiendo el proceso de desarrollo o mejoramiento de la idea de tesis. En el espacio de exploración, se discutirá las actividades que tienen que ver con buscar y construir el objeto de investigación. Seguidamente, en la etapa concreción, se discutirá los aspectos que contribuyan a decidir por el tema o foco de investigación, ubicar la problemática en un marco teórico, tiempo y presupuesto. El espacio que llamaremos etapa de planteamiento, permitirá discutir los aspectos relacionados con la definición de términos y sus relaciones (teorización) y cómo expresar el problema de investigación. Finalmente, en la etapa de delimitación, se tocarán los temas que permitan al interesado plasmar el proyecto de tesis (qué, cómo y por qué) en su aspecto teórico (única), práctico (preciso) y realista (capacidades humanas, recursos, etc.).

domingo, 25 de junio de 2017


¿Investigación científica aplicada en estadística o aplicación estadística?


lhuamanchumo@uni.edu.pe
25-06-17


I.                Introducción

Es común confundir investigación científica aplicada y aplicación cuando se trata de la ciencia estadística posiblemente porque ésta provee de herramientas de análisis a las demás ciencias y, consecuentemente, las tesis en estadística suelen enfocarse en aplicaciones estadísticas en otras áreas del conocimiento. Adicionalmente, se incurre en otro error al confundir, desde la perspectiva estadística, un problema práctico con un problema científico del campo de la estadística.

El problema surge porque al proyectarse una investigación como aplicación estadística toma preponderancia el campo de aplicación y, por lo tanto, se espera que el vacío de conocimiento sea buscado en el estado del arte de esta ciencia. Sin embargo, en este caso, la estadística solo interviene como una caja de herramientas de análisis. Cuando una investigación en estadística se formula de esta manera la tesis en estadística termina siendo una presentación de cómo se aplica una técnica estadística para resolver un problema práctico de otra especialidad más no en incrementar o proporcionar aportes significativos al conocimiento del campo donde se está aplicando y mucho menos al de la ciencia estadística.


Otro punto que es necesario resaltar es la diferencia entre problema práctico y problema científico. Aquel se formula como un obstáculo que requiere transformar la realidad y exige una propuesta de solución. Por el contrario, en un problema científico existe un vacío de conocimiento que requiere la formulación de preguntas que deben ser contestadas con evidencia empírica. Las tesis en estadística deben enfocarse en un problema científico. 


II.                Investigación aplicada en estadística

Frecuentemente se escucha: “… mi investigación es aplicada” para hacer referencia a una aplicación estadística y por contraposición a teórica (investigación básica). La investigación científica puede ser básica o aplicada. Una investigación científica básica llena vacíos de conocimiento y busca generalizar resultados, acrecienta el conocimiento aunque no tenga implicancia prácticas inmediatas y crea hipótesis. De igual forma, la investigación científica aplicada acrecienta el conocimiento pero utilizando hipótesis probadas por la ciencia básica y el estado del arte. Interesa la aplicación, utilización y consecuencias prácticas del conocimiento, es decir, se esperan descubrimientos de interés práctico.

La investigación científica aplicada en estadística está orientada a acrecentar el conocimiento de la ciencia estadística respondiendo cuestionamientos  relacionados con el dato usando hipótesis probadas por la investigación básica y el estado del arte de la estadística. Por ejemplo, Golberger (1964), Chambers y Cox (1967), McFadden (1974) y Amemiya (1981) proporcionan, bajo la escuela frecuentista, una solida base matemática en la formulación de los modelos logit y los supuestos de partida respecto a los datos. Aunque esto constituiría investigación básica, los hallazgos de Cramer (1999) en el estudio del efecto de los datos desbalanceados en los modelos logit se clasificarían dentro de la investigación científica aplicada. En el negocio de los microcréditos la observación de clientes que devuelven el crédito y los que no representan proporciones del 95% y 5% respectivamente (datos desbalanceados). Esto genera un problema con los supuestos de partida exigidos por la teoría estadística para la aplicación de los modelos logit con fines predictivos. Como se observa, la investigación responde a un interés práctico de aplicación en el negocio financiero motivado por un problema en los datos. Cramer utiliza las hipótesis y la formulación existente en el conocimiento científico de los modelos logit. La ciencia estadística ahora dispone de mayor conocimiento teórico que surgió por un interés aplicativo.    


Como un ejemplo de aplicación estadística se podría mencionar el trabajo de Chi (2006) quien desarrolla una predicción de no pago en la cartera de clientes de una entidad financiera utilizando los hallazgos de Cramer (1999, ibid.). 


III.                Desde la perspectiva de la ciencia de datos

Cuando los estudiantes tienen interés en desarrollar su tesis desde la perspectiva de la ciencia de datos surge la pregunta: ¿mi tesis tiene que ser multidisciplinaria? La respuesta es no. En principio, la misma metodología de la investigación científica exige la identificación de un vacío de conocimiento en un campo específico. Se debe tener en cuenta que la estadística desempeña un papel central en el cambio de paradigma que trae consigo la ciencia de datos. Sin embargo, lo importante siempre será el dato aunque cambie su naturaleza y soporte. Las técnicas computacionales son herramientas, sin el dato no existe la ciencia de datos. Inclusive, hacer investigación científica exige análisis estadístico. La investigación en máquina de aprendizaje, por ejemplo, requiere análisis estadístico para calificar sus resultados de manera concluyente.


En segundo lugar, la diferencia entre problema práctico y científico también es importante en la ciencia de datos. Nuevamente, el problema práctico está relacionado con extraer información que permita resolver problemas en el campo de los negocios, medicina, etc. Aquí es posible la colaboración multidisciplinaria. Por el contrario, en la ciencia interesa llenar vacíos de conocimiento en campos específicos como la estadística, matemáticas, máquina de aprendizaje, computación, etc. En la ciencia de datos como en cualquier otro campo del conocimiento humano la colaboración es más bien interdisciplinaria (Feast, 2010). El trabajo interdisciplinario integra diferentes perspectivas, se caracteriza por la negociación y argumentación y por los fuertes fundamentos del conocimiento de una disciplina en el sentido de favorecer la efectiva comunicación, participación, contraste y evaluación de hallazgos (Friedman, 2003; Wender, 1999). Dicho esto, si el estudiante decide por esta opción, entonces, tendrá que ser particularmente cuidadoso para presentar una justificación metodológica que explique por qué ha escogido este enfoque a lo largo de la discusión, sus implicancias y aportes en los hallazgos sin dejar de lado los aspectos retóricos que deberá tener en cuenta.

IV.                A manera de conclusión

Un estudiante de la especialidad de estadística debe tener en cuenta que un profesional en ciencia de datos es un estadístico con habilidades informáticas de modo que lo empodera para resolver problemas complejos de otras disciplinas haciendo uso de herramientas estadísticas e informáticas con el fin de crear significado y valor sobre los datos. Sin embargo, es importante que los tesistas de la especialidad de estadística tengan en cuenta que en la investigación científica se seguirán visualizando vacíos de conocimiento en la teoría estadística que son inherentes al dato independientemente de los nuevos escenarios tecnológicos. Aunque la velocidad de avance de la ciencia estadística es menor al avance tecnológico, la estadística debe ser parte del cambio paradigmático que trae consigo la ciencia de datos.


Referencias Bibliográficas

Chambers, E. A. y Cox, D. R. "Discrimination Between Alternative Binary Response Models," Biometrika.1967.54(3-4), pp. 573-78.
Chi, L. C., y Tang, T. C. Bankruptcy prediction: Application of logit analysis in export credit risks. Australian Journal of Management.2006. 31(1), 17-27.
Cramer, J. S.  Predictive performance of the binary logit model in unbalanced samples. Journal of the Royal Statistical Society: Series D (The Statistician). 1999. 48(1), 85-94.
Feast, L. Epistemological Positions Informing Theories of Design Research: Implications for the Design Discipline and Design Practice. Proceedings of 'Design and complexity', the 2010 Design Research Society International Conference (DRS2010). Design Research Society. Montreal, Canada.2010.
Friedman, K. Theory construction in design research: criteria: approaches, and methods. Design Studies. 2003. 24(6), 507-522. p.250.
Goldberger, A. S. Econometric theory. New York: Wiley. 1964.
McFadden, D. "Conditional Logit Analysis of Qualitative Choice Behavior," in Frontiers in econometrics. Edited by P. ZAREMBKA. New York: Academic Press. 1974. pp. 105-42.
Newendorp, N. A guide to writing a senior thesis in social studies. Faculty of Arts and Sciences. Harvard University. Harvard College. 2011. p.9
Rogers, Y., Scaife, M., & Rizzo, A. Interdisciplinarity: An Emergent or Engineered Process? In S. J. Derry, M. A. Gernsbacher & C. D. Schunn (Eds.), Interdisciplinary collaboration: An emerging cognitive science. Mahwah, New Jersey: Lawrence Erlbaum. 2005.
Wender, E. Communities of practice: learning, meaning, and identity. Cambridge: Cambridge University Press. 1999. p.103.



No hay comentarios.:

Publicar un comentario