Tema y problema de investigación en estadística
lhuamanchumo@uni.edu.pe
28-05-17
I.
Introducción
La elaboración del proyecto
de tesis en estadística es el resultado final de un proceso de mejoramiento de
una idea inicial cuyas etapas son: exploración, concreción, planteamiento y
delimitación. La idea inicial surge y se desarrolla en la etapa de exploración.
El estudiante o egresado tiene primero que estudiar un tema, investigar el
trasfondo conceptual y empírico. Es en la fase de concreción cuando el
estudiante ubica y define el problema de investigación dentro del área temática
estudiada. De allí que, en el presente artículo se hará referencia al tema y
problema de investigación por separado. Desde la etapa de estudios de pregrado,
el estudiante debe dedicar tiempo al estudio de un tema de investigación como
fase inicial para luego especificar una pregunta de investigación.
II.
El tema
Cuando el estudiante decide por un tema, debe atravesar primero una fase
preliminar dedicada a explorar y conocer el área temática y estado de avance de
la investigación en ese campo. Como menciona Maletta (2015), esta fase inicial
es esencialmente receptiva antes que creativa, aunque se debe tratar de una
recepción creativa y crítica. No es propiamente una actividad de investigación,
sino una actividad de estudio. El estudio es absorción y adquisición de
conocimiento mientras que la investigación es producción que requiere creación.
Se puede entender, entonces, que un estudiante debería estar
familiarizado con un tema, es decir, estar actualizado respecto a las
investigaciones recientes. Las buenas ideas iniciales surgen a partir de un
conocimiento previo del área temática y de una lectura actualizada de las
publicaciones científicas. Esta idea debe plantearse como una pregunta por
responder (vacío de conocimiento), con potencial para formularse más adelante
como problema de investigación.
Se puede ejercitar en ubicar temas y problemas de investigación
estudiando artículos científicos. Por ejemplo, en la investigación de Tang et
al. (2015) se dispone de una primera aproximación del tema a partir de las
palabras clave: outlier detection, context, categorical data y relational data.
De hecho, el tema específico está relacionado a la detección de outlier dentro
del tema más general: outlier mining o minería de outliers. Más aún, el
investigador establece que aunque existe una gran cantidad de investigaciones
sobre métodos de detección de outliers desde la perspectiva estadística,
proximidad, agrupamiento, métodos supervisados, semisupervisados, etc. el
análisis y explicación de por qué un objeto o grupo de objetos es considerado
outlier es todavía un tema poco investigado. De allí que, la investigación se
centra en la interpretabilidad de los outliers. Por ello, Tang y colaboradores
desarrollaron una noción de outlier contextual multidimensional para modelar el
contexto de un outlier y proponer un esquema de detección de outliers
contextuales. El lector puede percatarse que para que los investigadores
establezcan un tema de investigación tuvieron que estudiar de manera crítica
las investigaciones relacionadas al tema de detección de outliers publicadas
hasta la fecha.
III. El problema de investigación
En un interesante artículo, Narula (1974) analiza y propone maneras de
identificar problemas de investigación en estadística y sugiere que independientemente
del área de especialización, identificar un problema de investigación potencial
puede ser la etapa más frustrante del proceso de investigación. La situación
empeora debido a la falta de entrenamiento formal en la identificación de
problemas de investigación. En el afán de alcanzar unas pautas al respecto se
tiene que mencionar a Bachelard (1974) cuando sostiene que en la vida
científica, los problemas no surgen por si mismos. Para un espíritu científico,
todo conocimiento es la respuesta a una pregunta. Si no ha habido una pregunta,
no puede haber un conocimiento.
Se debe precisar, sin embargo, que este problema no tiene el carácter de
problema simplemente porque el estudiante no sepa la respuesta. Esto podría
simplemente reflejar su ignorancia sobre un tema. Tampoco puede constituir un
problema de investigación porque el estudiante constate que en la organización
donde desarrolla sus prácticas pre-profesionales no se conozca o aplique
determinadas técnicas estadísticas. El problema es efectivamente un problema
científico o de investigación cuando representa una interrogante o enigma para
la comunidad científica. Un problema científico representa un vacio en el
conocimiento colectivo. Un problema debe plantearse como problema científico y
puede ser: teórico, metodológico o práctico. La única manera de encontrar y
plantear una pregunta de investigación es mediante la revisión bibliográfica de
artículos científicos identificando la pregunta de investigación que se
especifica explícita o implícitamente. La pregunta de investigación está en un
permanente refinamiento en el curso de la investigación y conforme se dispone
de nuevas evidencias la pregunta puedes ser inclusive reformulada (Newendorp,
2011).
Ciertamente, Tang y colaboradores planteron la pregunta, desde una
perspectiva metodológica, si era posible no solo detectar outliers sino que
automática e integralmente se identificara la información contextual
correspondiente que permitiera estudiar la naturaleza de estos objetos a
diferencia de los métodos existentes que solo se centraban en identificar
objetos outliers que eran significativamente diferentes del conjunto restante
de datos.
IV.
Recomendación para el estudiante
Un buen punto de partida consiste en explorar en internet los posibles
temas de interés utilizando palabras claves o key words en google o
googleacademics. Las revistas especializadas en temas de ciencia de datos
proveen de manera libre los abstract de los artículos a partir de los cuales es
posible identificar palabras claves asociadas, tema, problema de investigación,
objetivo o hipótesis principal y metodología.
Referencias Bibliográficas
Bachelard, G. La
formación del espíritu científico. Buenos Aires. Siglo XXI. 1974
Maletta, H.
Hacer ciencia. Teoría y práctica de la producción científica. Universidad del Pacífico. 2015. pp. 424.
Narula, S. Systematic Ways to Identify Research Problems in Statistics.
International Statistical Review, Vol. 42, No. 2 (Ago., 1974), International
Statistical Institute (ISI). pp.
205-209.
Newendorp, N. A guide to writing a
senior thesis in social studies. Faculty of Arts and Sciences. Harvard
University. Harvard College. 2011. p10.
Tang, G., Pei, J., Bailey, J. y Dong, G. Mining multidimensional
contextual outliers from categorical relational data. Intelligent Data
Analysis. 19. IOS Press. 2015. pp. 1171-1192.