¿Investigación
científica aplicada en estadística o aplicación estadística?
lhuamanchumo@uni.edu.pe
25-06-17
I.
Introducción
Es
común confundir investigación científica aplicada y aplicación cuando se trata
de la ciencia estadística posiblemente porque ésta provee de herramientas de
análisis a las demás ciencias y, consecuentemente, las tesis en estadística suelen
enfocarse en aplicaciones estadísticas en otras áreas del conocimiento.
Adicionalmente, se incurre en otro error al confundir, desde la perspectiva
estadística, un problema práctico con un problema científico del campo de la estadística.
El
problema surge porque al proyectarse una investigación como aplicación estadística
toma preponderancia el campo de aplicación y, por lo tanto, se espera que el vacío
de conocimiento sea buscado en el estado del arte de esta ciencia. Sin embargo,
en este caso, la estadística solo interviene como una caja de herramientas de
análisis. Cuando una investigación en estadística se formula de esta manera la
tesis en estadística termina siendo una presentación de cómo se aplica una
técnica estadística para resolver un problema práctico de otra especialidad más
no en incrementar o proporcionar aportes significativos al conocimiento del
campo donde se está aplicando y mucho menos al de la ciencia estadística.
Otro
punto que es necesario resaltar es la diferencia entre problema práctico y
problema científico. Aquel se formula como un obstáculo que requiere
transformar la realidad y exige una propuesta de solución. Por el contrario, en
un problema científico existe un vacío de conocimiento que requiere la formulación
de preguntas que deben ser contestadas con evidencia empírica. Las tesis en
estadística deben enfocarse en un problema científico.
II.
Investigación aplicada en estadística
Frecuentemente
se escucha: “… mi investigación es aplicada” para hacer referencia a una
aplicación estadística y por contraposición a teórica (investigación básica).
La investigación científica puede ser básica o aplicada. Una investigación
científica básica llena vacíos de conocimiento y busca generalizar resultados,
acrecienta el conocimiento aunque no tenga implicancia prácticas inmediatas y crea
hipótesis. De igual forma, la investigación científica aplicada acrecienta el
conocimiento pero utilizando hipótesis probadas por la ciencia básica y el
estado del arte. Interesa la aplicación, utilización y consecuencias prácticas
del conocimiento, es decir, se esperan descubrimientos de interés práctico.
La
investigación científica aplicada en estadística está orientada a acrecentar el
conocimiento de la ciencia estadística respondiendo cuestionamientos relacionados con el dato usando hipótesis
probadas por la investigación básica y el estado del arte de la estadística. Por
ejemplo, Golberger (1964), Chambers y Cox (1967), McFadden (1974) y Amemiya
(1981) proporcionan, bajo la escuela frecuentista, una solida base matemática
en la formulación de los modelos logit y los supuestos de partida respecto a
los datos. Aunque esto constituiría investigación básica, los hallazgos de
Cramer (1999) en el estudio del efecto de los datos desbalanceados en los
modelos logit se clasificarían dentro de la investigación científica aplicada. En
el negocio de los microcréditos la observación de clientes que devuelven el
crédito y los que no representan proporciones del 95% y 5% respectivamente
(datos desbalanceados). Esto genera un problema con los supuestos de partida exigidos
por la teoría estadística para la aplicación de los modelos logit con fines
predictivos. Como se observa, la investigación responde a un interés práctico
de aplicación en el negocio financiero motivado por un problema en los datos.
Cramer utiliza las hipótesis y la formulación existente en el conocimiento científico
de los modelos logit. La ciencia estadística ahora dispone de mayor
conocimiento teórico que surgió por un interés aplicativo.
Como
un ejemplo de aplicación estadística se podría mencionar el trabajo de Chi
(2006) quien desarrolla una predicción de no pago en la cartera de clientes de
una entidad financiera utilizando los hallazgos de Cramer (1999, ibid.).
III.
Desde la perspectiva de la ciencia de datos
Cuando
los estudiantes tienen interés en desarrollar su tesis desde la perspectiva de
la ciencia de datos surge la pregunta: ¿mi tesis tiene que ser
multidisciplinaria? La respuesta es no. En principio, la misma metodología de
la investigación científica exige la identificación de un vacío de conocimiento
en un campo específico. Se debe tener en cuenta que la estadística desempeña un
papel central en el cambio de paradigma que trae consigo la ciencia de datos.
Sin embargo, lo importante siempre será el dato aunque cambie su naturaleza y
soporte. Las técnicas computacionales son herramientas, sin el dato no existe
la ciencia de datos. Inclusive, hacer investigación científica exige análisis
estadístico. La investigación en máquina de aprendizaje, por ejemplo, requiere
análisis estadístico para calificar sus resultados de manera concluyente.
En
segundo lugar, la diferencia entre problema práctico y científico también es
importante en la ciencia de datos. Nuevamente, el problema práctico está
relacionado con extraer información que permita resolver problemas en el campo
de los negocios, medicina, etc. Aquí es posible la colaboración
multidisciplinaria. Por el contrario, en la ciencia interesa llenar vacíos de
conocimiento en campos específicos como la estadística, matemáticas, máquina de
aprendizaje, computación, etc. En la ciencia de datos como en cualquier otro
campo del conocimiento humano la colaboración es más bien interdisciplinaria (Feast,
2010). El trabajo interdisciplinario integra diferentes perspectivas, se
caracteriza por la negociación y argumentación y por los fuertes fundamentos
del conocimiento de una disciplina en el sentido de favorecer la efectiva
comunicación, participación, contraste y evaluación de hallazgos (Friedman,
2003; Wender, 1999). Dicho esto, si el estudiante decide por esta opción,
entonces, tendrá que ser particularmente cuidadoso para presentar una
justificación metodológica que explique por qué ha escogido este enfoque a lo
largo de la discusión, sus implicancias y aportes en los hallazgos sin dejar de
lado los aspectos retóricos que deberá tener en cuenta.
IV.
A manera de conclusión
Un
estudiante de la especialidad de estadística debe tener en cuenta que un profesional
en ciencia de datos es un estadístico con habilidades informáticas de modo que
lo empodera para resolver problemas complejos de otras disciplinas haciendo uso
de herramientas estadísticas e informáticas con el fin de crear significado y
valor sobre los datos. Sin embargo, es importante que los tesistas de la
especialidad de estadística tengan en cuenta que en la investigación científica
se seguirán visualizando vacíos de conocimiento en la teoría estadística que son
inherentes al dato independientemente de los nuevos escenarios tecnológicos.
Aunque la velocidad de avance de la ciencia estadística es menor al avance
tecnológico, la estadística debe ser parte del cambio paradigmático que trae
consigo la ciencia de datos.
Referencias Bibliográficas
Chambers, E. A. y Cox, D. R.
"Discrimination Between Alternative Binary Response Models,"
Biometrika.1967.54(3-4), pp. 573-78.
Chi, L. C., y Tang, T. C. Bankruptcy
prediction: Application of logit analysis in export credit risks.
Australian Journal of Management.2006. 31(1), 17-27.
Cramer, J. S. Predictive
performance of the binary logit model in unbalanced samples. Journal of the
Royal Statistical Society: Series D (The Statistician). 1999. 48(1), 85-94.
Feast, L. Epistemological
Positions Informing Theories of Design Research: Implications for the Design
Discipline and Design Practice. Proceedings of 'Design and complexity', the
2010 Design Research Society International Conference (DRS2010). Design
Research Society. Montreal, Canada.2010.
Friedman, K. Theory construction in
design research: criteria: approaches, and methods. Design Studies. 2003. 24(6), 507-522. p.250.
Goldberger, A. S. Econometric theory.
New York: Wiley. 1964.
McFadden, D. "Conditional Logit
Analysis of Qualitative Choice Behavior," in Frontiers in econometrics.
Edited by P. ZAREMBKA. New York: Academic Press. 1974. pp. 105-42.
Newendorp, N. A guide to writing a
senior thesis in social studies. Faculty of Arts and Sciences. Harvard
University. Harvard College. 2011. p.9
Rogers, Y., Scaife, M., & Rizzo,
A. Interdisciplinarity: An Emergent or Engineered Process? In
S. J. Derry, M. A. Gernsbacher & C. D. Schunn (Eds.), Interdisciplinary collaboration:
An emerging cognitive science. Mahwah, New Jersey: Lawrence Erlbaum. 2005.
Wender, E. Communities of practice:
learning, meaning, and identity. Cambridge: Cambridge
University Press. 1999. p.103.
No hay comentarios.:
Publicar un comentario