Bienvenidos al Blog de TIcid


Presentación

Motivados por las permanentes consultas respecto a la elaboración de la tesis en estadística y la experiencia acumulada en el desarrollo de talleres de tesis, el equipo del TICiD desarrolla un espacio de discusión que permita alcanzar recomendaciones sobre cómo elaborar la tesis en el contexto de la ciencia de datos. Es importante destacar que nos centramos en el proyecto de tesis porque consideramos que éste es el último eslabón de un proceso que llamamos “mejoramiento de la idea de tesis”, a saber: exploración, concreción, planteamiento y delimitación.

De allí que, los artículos se organizarán siguiendo el proceso de desarrollo o mejoramiento de la idea de tesis. En el espacio de exploración, se discutirá las actividades que tienen que ver con buscar y construir el objeto de investigación. Seguidamente, en la etapa concreción, se discutirá los aspectos que contribuyan a decidir por el tema o foco de investigación, ubicar la problemática en un marco teórico, tiempo y presupuesto. El espacio que llamaremos etapa de planteamiento, permitirá discutir los aspectos relacionados con la definición de términos y sus relaciones (teorización) y cómo expresar el problema de investigación. Finalmente, en la etapa de delimitación, se tocarán los temas que permitan al interesado plasmar el proyecto de tesis (qué, cómo y por qué) en su aspecto teórico (única), práctico (preciso) y realista (capacidades humanas, recursos, etc.).

domingo, 28 de mayo de 2017

Tema y problema de investigación en estadística

lhuamanchumo@uni.edu.pe
28-05-17



      I.          Introducción

La elaboración del proyecto de tesis en estadística es el resultado final de un proceso de mejoramiento de una idea inicial cuyas etapas son: exploración, concreción, planteamiento y delimitación. La idea inicial surge y se desarrolla en la etapa de exploración. El estudiante o egresado tiene primero que estudiar un tema, investigar el trasfondo conceptual y empírico. Es en la fase de concreción cuando el estudiante ubica y define el problema de investigación dentro del área temática estudiada. De allí que, en el presente artículo se hará referencia al tema y problema de investigación por separado. Desde la etapa de estudios de pregrado, el estudiante debe dedicar tiempo al estudio de un tema de investigación como fase inicial para luego especificar una pregunta de investigación.


    II.          El tema

Cuando el estudiante decide por un tema, debe atravesar primero una fase preliminar dedicada a explorar y conocer el área temática y estado de avance de la investigación en ese campo. Como menciona Maletta (2015), esta fase inicial es esencialmente receptiva antes que creativa, aunque se debe tratar de una recepción creativa y crítica. No es propiamente una actividad de investigación, sino una actividad de estudio. El estudio es absorción y adquisición de conocimiento mientras que la investigación es producción que requiere creación.

Se puede entender, entonces, que un estudiante debería estar familiarizado con un tema, es decir, estar actualizado respecto a las investigaciones recientes. Las buenas ideas iniciales surgen a partir de un conocimiento previo del área temática y de una lectura actualizada de las publicaciones científicas. Esta idea debe plantearse como una pregunta por responder (vacío de conocimiento), con potencial para formularse más adelante como problema de investigación.

Se puede ejercitar en ubicar temas y problemas de investigación estudiando artículos científicos. Por ejemplo, en la investigación de Tang et al. (2015) se dispone de una primera aproximación del tema a partir de las palabras clave: outlier detection, context, categorical data y relational data. De hecho, el tema específico está relacionado a la detección de outlier dentro del tema más general: outlier mining o minería de outliers. Más aún, el investigador establece que aunque existe una gran cantidad de investigaciones sobre métodos de detección de outliers desde la perspectiva estadística, proximidad, agrupamiento, métodos supervisados, semisupervisados, etc. el análisis y explicación de por qué un objeto o grupo de objetos es considerado outlier es todavía un tema poco investigado. De allí que, la investigación se centra en la interpretabilidad de los outliers. Por ello, Tang y colaboradores desarrollaron una noción de outlier contextual multidimensional para modelar el contexto de un outlier y proponer un esquema de detección de outliers contextuales. El lector puede percatarse que para que los investigadores establezcan un tema de investigación tuvieron que estudiar de manera crítica las investigaciones relacionadas al tema de detección de outliers publicadas hasta la fecha.


  III.     El problema de investigación


En un interesante artículo, Narula (1974) analiza y propone maneras de identificar problemas de investigación en estadística y sugiere que independientemente del área de especialización, identificar un problema de investigación potencial puede ser la etapa más frustrante del proceso de investigación. La situación empeora debido a la falta de entrenamiento formal en la identificación de problemas de investigación. En el afán de alcanzar unas pautas al respecto se tiene que mencionar a Bachelard (1974) cuando sostiene que en la vida científica, los problemas no surgen por si mismos. Para un espíritu científico, todo conocimiento es la respuesta a una pregunta. Si no ha habido una pregunta, no puede haber un conocimiento.

Se debe precisar, sin embargo, que este problema no tiene el carácter de problema simplemente porque el estudiante no sepa la respuesta. Esto podría simplemente reflejar su ignorancia sobre un tema. Tampoco puede constituir un problema de investigación porque el estudiante constate que en la organización donde desarrolla sus prácticas pre-profesionales no se conozca o aplique determinadas técnicas estadísticas. El problema es efectivamente un problema científico o de investigación cuando representa una interrogante o enigma para la comunidad científica. Un problema científico representa un vacio en el conocimiento colectivo. Un problema debe plantearse como problema científico y puede ser: teórico, metodológico o práctico. La única manera de encontrar y plantear una pregunta de investigación es mediante la revisión bibliográfica de artículos científicos identificando la pregunta de investigación que se especifica explícita o implícitamente. La pregunta de investigación está en un permanente refinamiento en el curso de la investigación y conforme se dispone de nuevas evidencias la pregunta puedes ser inclusive reformulada (Newendorp, 2011).

Ciertamente, Tang y colaboradores planteron la pregunta, desde una perspectiva metodológica, si era posible no solo detectar outliers sino que automática e integralmente se identificara la información contextual correspondiente que permitiera estudiar la naturaleza de estos objetos a diferencia de los métodos existentes que solo se centraban en identificar objetos outliers que eran significativamente diferentes del conjunto restante de datos.

  IV.          Recomendación para el estudiante


Un buen punto de partida consiste en explorar en internet los posibles temas de interés utilizando palabras claves o key words en google o googleacademics. Las revistas especializadas en temas de ciencia de datos proveen de manera libre los abstract de los artículos a partir de los cuales es posible identificar palabras claves asociadas, tema, problema de investigación, objetivo o hipótesis principal y metodología. 

Referencias Bibliográficas


Bachelard, G. La formación del espíritu científico. Buenos Aires. Siglo XXI. 1974
Maletta, H. Hacer ciencia. Teoría y práctica de la producción científica. Universidad del Pacífico. 2015. pp. 424.
Narula, S. Systematic Ways to Identify Research Problems in Statistics. International Statistical Review, Vol. 42, No. 2 (Ago., 1974), International Statistical Institute (ISI).  pp. 205-209.
Newendorp, N. A guide to writing a senior thesis in social studies. Faculty of Arts and Sciences. Harvard University. Harvard College. 2011. p10.
Tang, G., Pei, J., Bailey, J. y Dong, G. Mining multidimensional contextual outliers from categorical relational data. Intelligent Data Analysis. 19. IOS Press. 2015. pp. 1171-1192.