Cómo citar el artículo (Normas APA): Villanueva, M. Ronzón, J. y Luna, J.
(2014). Factores
de elección de licenciaturas en la División Académica de Informática y Sistemas (DAIS)
aplicando minería de datos.
Enl@ce
Revista Venezolana de Información, Tecnología y Conocimiento. 11 (1), 41-49
Enl@ce: Revista Venezolana de
Información,
Tecnología y
Conocimiento
ISSN: 1690-7515
Depósito legal pp
200402ZU1624
Año 11: No. 1,
Enero-Abril 2014, pp. 41-49
Factores de elección de licenciaturas
en la División
Académica de Informática y Sistemas (DAIS) aplicando minería de datos
Manuel Villanueva1
José Ronzón2
Joel Luna3
Resumen
El objetivo de la
investigación permite identificar los factores que influyen en los estudiantes,
al momento de seleccionar una de las cuatro Licenciaturas
que ofrece la División Académica de Informática y Sistemas (DAIS) de la Universidad
Juárez Autónoma de Tabasco, México. Su desarrollo se realizó en seis Subsistemas
de Instituciones de Educación Media Superior de carácter público estatal y
federal del estado de Tabasco. El enfoque metodológico se fundamento mediante la aplicación del
proceso de KDD “Knowledge
Discovery in Databases” conocido como Descubrimiento de Conocimiento en Bases de Datos, el cual es interpretado
como “El proceso no trivial de identificar patrones válidos, nuevos,
potencialmente útiles y en última instancia comprensible en los datos”, utilizando
la técnica de Predicción de Regresión
Lineal de la Herramienta Weka. Para la obtención de
información y respectivo análisis, se diseñó un cuestionario aplicado a los
seis Subsistemas, cuyos resultados informacionales fueron almacenados en una
base de datos y se depuró para aplicarle la técnica de minería de
datos. Los resultados obtenidos por la Herramienta Weka, muestran los motivos y factores que influyen en la
toma de decisiones de los alumnos
al momento de la
selección de una carrera. Se prevé que los resultados han de ser considerados
por las autoridades académicas para
la toma de decisiones y definición de
estrategias que les permitan promocionar sus licenciaturas.
Palabras clave: factores de
elección, minería de datos, técnica de predicción, regresión lineal, weka.
1 Licenciado en
Física. Especialistas Ciencias de la Computación. Magister en Cómputo
Estadístico. Magister en Ciencias de la Computación. Magister en Ingeniería
de Sistemas. Actualmente cursa el Doctorado en Sistemas Computacionales en
la Universidad del Sur. Correo electrónico: manuel.villanueva@ujat.mx 2 Licenciado en Economía. Magister en
ciencias en Planificación de Empresas y Desarrollo Regional. Profesor
Investigador de la División Académica de Informática y Sistemas de la
Universidad Juárez Autónoma de Tabasco. Actualmente es el responsable del
grupo de investigación: Modernización de Sistemas de Software en la Calidad Organizacional y
la Línea de Generación y Aplicación del Conocimiento. Correo electrónico: jronson@hotmail.com, jose.ronson@ujat.mx 3 Licenciado en Sistemas Computacionales de la Universidad Juárez Autónoma de Tabasco. Correo electrónico: leoj-alm@hotmail.com
1 Lice
Choice Factors of Academic Degrees in Computer Science
and Systems Division of Applying Data Mining
Abstract
The
objective of the research makes it possible to identify the factors that
influence the students, at the time of selecting one of the four undergraduate
degrees offered by the Division of Academic Computing and Systems (DAIS) of the
University of Juarez Autonomous Tabasco, Mexico. Its development was carried
out in six subsystems of Secondary Education Institutions of a public nature of
the state and federal state of Tabasco. The methodological approach basis
through the implementation of the KDD process "Knowledge Discovery in
Databases" known as Knowledge Discovery in databases, which is interpreted
as "the non-trivial process of identifying valid patterns, new,
potentially useful, and ultimately understandable in the data", using the technique of linear regression prediction tool
"WEKA". For the obtaining of information and analysis, design a
questionnaire administered to the six subsystems, informational whose results
were stored in a database and debugged to apply the technique of data mining.
The results obtained by the "WEKA" tool, show the reasons and factors
that influence the decision-making of the students at the time of the selection
of a career. It is anticipated that the results have to be considered by the
academic authorities for the decision-making and definition of strategies that
will enable them to promote their undergraduate degrees.
Key words: Factors of choice, Data mining, Predictive
Technical, Linear regression, "WEKA
Introducción
La técnica
de minería de datos en la actualidad se posiciona de forma estratégica y a su
vez promueve ventajas en el proceso de
la toma de decisiones en determinadas empresas e instituciones.
Asimismo,
es una técnica considerada en el ámbito mundial, sobre todo se resalta su
importancia en el área educativa, al considerar que a través de esta, se
generan y almacenan altos volúmenes de datos, que permiten soportar y determinar en las Instituciones Edu-
cativas,
cuáles son las demandas de
la sociedad actual Calleja (2010).
De igual
forma, se desea conocer los factores
que influyen en
la elección de una licenciatura por parte del estudiante,
así como también determinar si este domina el conocimiento sobre el contexto a
enfrentar o cuáles son los aspectos influyentes de este, en
momentos cruciales, en caso de requerir
llevar a efecto una toma de decisión. En tal sentido, si se considera,
que los lapso de tiempo para poder
decidir son relativamente cortos, aunado
con los diversos cambios durante la transición
de la adolescencia,
y
madurez intelectual, se prevé la efectividad de toma de decisiones asertivas, al considerar
que esta define el rumbo que tomará su vida y conforma el estilo de la
misma, González y Álvarez (2008).
De manera muy concreta, en el estado de Tabasco y de acuerdo con el objeto de estudio la
División Académica de Informática y Sistemas
(DAIS), de la
Universidad Juárez Autónoma de Tabasco
(UJAT), se publicó el primer estudio formal relacionado con algunas
de las razones principales de
la elección de la
Licenciatura en Informática Administrativa, cuyos datos estadísticos muestran
el decreciente número de estudiantes que han ingresado a las carreras de la
DAIS, que ofrece la UJAT, según (Villanueva, Zapata, Arceo, y Ronzón, 2004, p. 36)
Tabla 1
Serie
histórica de nuevo ingreso
P.E. |
2007 |
2008 |
2009 |
2010 |
2011 |
2012 |
2013 |
LIA |
132 |
178 |
215 |
157 |
126 |
102 |
74 |
LSC |
127 |
205 |
248 |
257 |
214 |
197 |
138 |
LT |
0 |
38 |
49 |
36 |
22 |
6 |
21 |
LTI |
0 |
23 |
34 |
22 |
8 |
21 |
21 |
Tot. |
259 |
444 |
546 |
472 |
370 |
326 |
254 |
Fuente:
Gil, (2010), Gil, (2011);
Gil, (2012), Piña, (2013) y Piña, (2014)
Los resultados presentados evidencian la evolución de una problemática
iniciada desde el año 2009 y en la actualidad prevalece, situación que
promovió la conformación de 11 comisiones para responder al incremento de la matrícula en la DAIS.
Una de estas comisiones, específicamente la de Investigación Educativa,
logró integrar dos Proyectos de Investigación
Institucionales denominados:
· estudio sobre factores de elección de las licenciaturas que ofrece la
División Académica de Informática y
Sistemas y,
· estudio de demanda potencial en el ámbito educativo medio superior de Tabasco, en el área de tecnologías de la información.
Sin embargo, en la
actualidad no se dispone de un estudio integral que determine cuáles son los
factores que influyen en la toma de decisiones y selección de los estudiantes
correspondientes a la educación media superior, y que a su vez apoye a las autoridades de la DAIS
para lograr incrementar
el número de alumnos a las carreras ofertadas.
Es por ello, que la
presente investigación aplicada, titulada “Estudio
sobre factores de elección de las licenciaturas que ofrece la DAIS.
Aplicando Minería de datos. Caso: Método de Regresión, mediante la
Técnica de Regresión Lineal”, busca
detectar estos factores, con el fin de contribuir con la superación de la situación
expuesta.
Objetivo
El objetivo se fundamenta en la necesidad de identificar los
factores que influyen en los alumnos
para la elección del nivel medio
de educación superior mediante
la minería de datos, específicamente hacia las
licenciaturas que ofrece la División Académica de Informática y
Sistemas (DAIS) de la Universidad Juárez Autónoma de Tabasco,
México.
Su desarrollo, se llevó a efecto mediante el análisis de los datos
a través de la aplicación del método de
regresión, específicamente la técnica de regresión lineal, mediante
la Herramienta WEKA.
Metodología
Para el análisis y recolección de datos, se utilizó el enfoque cuantitativo, el cual
permite mediante el uso de las técnicas de recolección y el análisis de datos, así como de métodos estadísticos, determinar estudios de casos concretos para
llegar a una descripción
general o comprobar
las hipótesis establecidas previamente, es decir busca la mayor claridad entre los
elementos que conforman el problema, buscando que tenga definición, los limita
y con exactitud saber dónde inicia el problema según Hernández, Fernández y
Baptista, (2007).
Población y muestra
Con base de lo expuesto, para lograr la recopilación de la
información relacionada con las preferencias de la elección de una Licenciatura
en el Área de Tecnologías de la In-
formación y Comunicaciones, fue considerada como muestra del
estudio los alumnos del Centro de
Bachillerato Tecnológico Agropecuario (CBTA), Educación Media Superior a
Distancia (COBATAB EMSAD), Colegio de Bachilleres de Tabasco (COBATAB),
Instituto de Difusión Técnica (IDIFTEC), Colegio Nacional de Educación
Profesional Técnica (CONALEP), Centro de Bachillerato Tecnológico Industrial y
de Servicios (CBTIS) / Centro de Estudios Tecnológicos Industrial y de
Servicios (CETIS) y Centro
de Estudios Científicos y
Tecnológicos del Estado de Tabasco
(CECYTE).
Muestra cuyos resultados permiten
que las autoridades de la
DAIS conozcan los principales
factores de incidencia y se les facilite
el definición o dominio de estrategias que soporten sus decisiones de forma adecuada y a su vez se
proyecte el incremento de la matrícula estudiantil. Asimismo, la investigación está
basada en un proceso que se denomina “fases del proceso de extracción
del conocimiento”, el Knowledge Discovery in Database (KDD). Es un proceso interactivo e iterativo.
Iterativo porque al regresar y avanzar para obtener información de
calidad del proceso se interaccionan
con estos, es
decir que las
fases correspondientes pueden ser
en cualquier momento interrumpidas para volver a alguno de sus pasos
anteriores, siendo este proceso de iteración muchas veces
necesario para poder lograr un descubrimiento de calidad, a su vez es interactivo por que interviene el usuario con la
validación de la información extraída.
De acuerdo Hernández, Ramírez y Ferri (2004) (citado por Brito,
Rosete y Acosta, 2008, p.2) el proceso de KDD,
se organiza en torno a cinco pasos, que se describen:
·
fase
de Integración y recopilación de datos.
·
fase de selección, limpieza y transformación
de datos.
·
fase de la Minería de datos.
·
Fase
de evaluación e interpretación.
·
Fase de difusión.
Desde la
perspectiva teórica esta investigación
considera como base el proceso de descubrimiento de conocimiento las
fases descritas por Hernández, Ramírez, y
Ferri, (2004), las cuales se fundamentan desde una repetición
interactiva de los pasos
que se especifican:
· limpieza de
datos: eliminar los datos ruidosos o irrelevantes.
· integración de
datos: combinar los datos desde
múltiples fuentes.
· selección
de datos: recuperar desde la base de datos los datos relevantes para la tarea
como objeto de análisis.
· transformación de
los datos: transformar los datos
o llevarlos a formas apropiadas para extraer el conocimiento.
· Minería de
datos: aplicar métodos inteligentes para
extraer los patrones de los datos.
· Evaluación
de patrones: identificar los patrones verdaderamente interesantes representando
conocimiento basado en medidas de interés.
· Representación
del conocimiento: utilizar técnicas de representación y visualización para
mostrar al usuario el conocimiento extraído.
· Presentación
de los conocimientos.
Como
herramienta de soporte ha sido aplicada la técnica de regresión lineal. Concebida de esta forma cuando la
función es lineal, es decir, requiere la determinación de
dos parámetros: la
pendiente y la ordenada en el origen de la recta de regresión, y = a
x + b.
La
regresión permite además, determinar el grado de dependencia de las series de
valores X e
Y, prediciendo el valor estimado que se puede obtener para
un valor x que no esté en la distribución.
Gráfica 1
Regresión lineal
Fuente: Morates (1997)
También se
hizo uso de la Herramienta Weka (Waikato Environment for Knowledge Analysis). Utilizada para
la operatividad de la técnica
de “Regresión Lineal Automa-tizada”
concebida como una plataforma de
Software para aprendizaje automático
y minería de datos escritos en Java y desarrollado en
la Universidad de Waikato.
Weka,
es un software libre
distribuido bajo licencia
GNU-GPL (Licencia Pública General del Sistema operativo GNU), donde GNU
es un sistema Operativo desarrollado bajo UNIX que es considerado un software
libre.
Weka, como
software programado en Java está orientado a la extracción de conocimientos
desde bases de datos con grandes cantidades de información. (Alonso, 2013).
Existen otras herramientas similares como Oracle Data Minero Clementine, pero el hecho de que Weka
sea desarrollado bajo licencia GPL, lo hace
una alternativa muy interesante.
Resultados
Los resultados
determinan el análisis de los subsistemas según se mencionan, asimismo permiten
el análisis y la interrelación de las variables obtenidas en la investigación y
la base de
datos que se encuentra en el proyecto "Factores de
elección de las carrera de la DAIS", con el fin de
modelar la información obtenida.
Análisis del subsistema
1.
CBTA
Se determinó que los
motivos que influyen en la selección de las carreras en los alumnos de este
subsistema inciden con: aspectos vocacionales
y habilidades personales.
De igual forma, se
considera en la escala de Muy importante el
grado de interés que le dan a
los factores que influyen en su
elección.
Factores:
· la
conveniencia de esa carrera para las personas de género masculino.
· la posibilidad
de conseguir empleo.
· el ser
accesible, para efectos de costos
Análisis del subsistema
2. CETIS/CBTIS
Los resultados en este
subsistema son coincidentes con los obtenidos del subsistema 1 CBTA. Sin
embargo, el grado de importancia que le dan a los factores que influyen en su
elección es: Importante.
Factores:
· el ser
accesible por su costo
· el poseer
conocimientos o estudios previos.
· las
calificaciones obtenidas en las materias afines a la carrera
Análisis del subsistema
3. CECYTE
Se encontró que los
motivos que conllevan a la elección de la carrera en los alumnos de este subsistema se basan en el consejo
de familiares y amigos. También
se detectó el grado
de importancia que le ptorgan a los factores
que influyen en su
elección es: Muy importante
Factor:
· la
influencia de amigos
· la
conveniencia de esa carrera para las personas del mismo género.
· la
posibilidad de conseguir empleo
Análisis del subsistema
4. COBATAB
Planteles presenciales.
Se identificó que los
motivos que inducen a la elección de carrera en los alumnos de este Subsistema
son: por tener vocación y habilidades personales. Y el
grado de importancia que le dan a
los factores que influyen en su
elección es: Muy importante
Factor:
· la
aceptación de mis padres
· el hecho de
ser accesible por su costo
· la
conveniencia de esa carrera para las personas de sexo masculino
Planteles a distancia.
Con
respecto a este subsistema, se encontró que los motivos que impulsan a la
elección de carrera en los alumnos de este plantel son diversas y a su vez el grado
de relevancia que le dan a los factores que influyen en
su elección es: Muy importante
Factor:
· la
conveniencia de esa carrera para las personas del mismo sexo.
· la
aceptación de mis padres
· el hecho de
tener conocimientos o estudios previos
Análisis del subsistema
5. CONALEP
Prevalece en este
subsistema, la selección de la carrera en función de la vocación, así como del
dominio de habilidades personales, y la escala en su elección
es: Muy
importante
Factor:
· la
obtención de buenos ingresos
· el ser accesible por su costo
· la
influencia de mis amigos
Análisis del subsistema
6. IDIFTEC
La vocación y el
dominio de habilidades personales, aspectos claves de la elección de carrera, y
como grado de importancia que le dan a los factores que influyen en su elección
es: Importante
Factor:
· la
posibilidad de conseguir empleo.
· el
reconocimiento social que tienen los profesionistas de esta carrera
· la
obtención de buenos ingresos
Conclusiones y
recomendaciones
La aplicación de la
herramienta de KDD y el análisis de las pruebas realizadas mediante el
algoritmo de clasificación Regresión Lineal de la
la
aplicación de la herramienta de KDD y el análisis de las pruebas realizadas
mediante el algoritmo de clasificación Regresión Lineal de la herramienta Weka, se concluye
satisfactoriamente, luego de
aplicar cada una de las fases o etapas de KDD en donde fue necesario limpiar y
dividir la base
de datos única
para su mejor análisis.
Por lo cual, se determina a continuación los tres principales motivos influyentes en los alumnos de nivel
medio superior de
carácter público, para elegir una de las cuatro licenciaturas que ofrece
la DAIS:
a).-“A
los egresados de la
carrera les pagan bien” con
un 57%, “consejo de familiares y
amigos” con un
29 % y “por
tener vocación y habilidades personales” con un 14%.
b).-Se determina
también, que el grado de importancia que le dan los alumnos a los factores que
ellos mismos eligieron para su elección de la carrera son: “Muy
importantes” con el
57% e “Importante” con un 43%.
c).- Como conclusión
general en este proyecto es que se alcanzaron los objetivos propuestos, ya que
se obtuvieron satisfactoriamente los 10 factores de
elección que influyen en los alumnos de nivel medio superior al momento de
elegir una carrera los cuales son: “La conveniencia de esa carrera
para las personas de género afín” con un 21%,
“el
ser accesible por su costo” con un 17 %, “el poseer conocimientos o
estudios previos” con un 13%, “La posibilidad de conseguir empleo” con un 13%, “La influencia de mis amigos” con un
13%, “El campo de trabajo es amplio y
con futuro” con un 8%, “La obtención
de buenos ingresos” con un 8%, “la aceptación de mis padres” con un 8%, "las calificaciones obtenidas en las materias afines a la
carrera” con un 4%,
y, “el reconocimiento social que tienen
los profesionistas de esta carrera” con
un 4%.
d).- Conocer
los motivos y los
factores que impulsan a los
alumnos del nivel medio superior a la toma de decisión sobre que
licenciatura van a
elegir, es de
gran utilidad para las autoridades universitarias, con el fin afianzar la toma de decisiones
correspondientes, así como definir estrategias que permitan dar a conocer a profundidad
las licenciaturas que
ofrece la DAIS.
Las dificultades
encontradas para llegar a estos resultados, se conciben como no relevantes ya que algunos de estas fueron
errores de captura de datos y
caracteres inválidos encontrados
en la base de datos. Con respecto a lo
anterior, para el uso de la base de
datos se usó
una hoja de cálculo de Open Office que al ser de
licencia de código abierto, facilitó su utilidad al ser utilizado sobre cualquier
sistema operativo, facilitando así la conversión del archivo a formato de .csv
antes de realizar
el análisis con
el software de Weka.
Bibliografía
Alonso C. (2013). Obtenido de Waitako Environment
for Knowledge Analysis. Introducción Básica. Departamento de Informática de la universidad
de Va-
lladolid.
Recuperado de http://www.infor.uva.es/~calonso/IAII/Aprendizaje/weka/IntroduccionWeka.pdf
Recuperado el 22/03/2013.
Brito, R., Rosete, A. y
Acosta, R. (2008) Desarrollo de un proceso de KDD en el ámbito docente:
Preparación de los datos. 14 Convención científica de ingeniería y
arquitectura.
Calleja,
A. (2010). Minería de Datos con Weka para la
predicción del Precio de Automóviles de Segunda Mano. Recuperado de https://riunet.upv.es/mineria-de-datos- con-weka/PFC_DSIC80_ AgustínCalle
ja_2.pdf Recuperado el 25/02/2013.
Gil, C.
(2011). Segundo informe de Actividades 2009. UJAT. Primera Edición 2010,
Villahermosa, Tabasco, México.
Gil, C.
(2011). Tercer Informe de Actividades 2010. UJAT. Primera Edición 2011,
Villahermosa, Tabasco, México.
Gil, C.
(2012). Cuarto Informe de Actividades 2011. UJAT. Primera Edición 2012,
Villahermosa, Tabasco, México.
González, R.
y Álvarez, I. (2008). La orientación vocacional en los alumnos de nuevo
ingreso. Universidad
Nacional Autónoma de
México. México, Distrito Federal.
Hernández, J., Ramírez,
Q. y Ferri R. (2004). Introducción a
la Minería de Datos. Madrid: Pearson Prentice Hall.
Hernández,
R.; Fernández, C. y Baptista, P. (2007). Metodología de la Investigación.
México. McGraw-Hill.
Morates, D. (1997). Técnicas de regresión
lineal mediante WEKA., San Francisco. Morgan Robbison.
Piña, J.
(2013). Primer Informe de Actividades 2012. UJAT. Primera Edición 2013,
Villahermosa, Tabasco, México.
Piña, J.
(2014). Segundo Informe de Actividades 2013. UJAT. Primera Edición 2014, Villahermosa,
Tabasco, México.
Villanueva,
M., Javier, A., Arceo, G., Zapata,
T. y Ronzón,
J. (2004). Estudio de Egresados
de la Licenciatura en Informática Administrativa COHORTE 1997. Universidad
Juárez Autónoma de Tabasco. División Académica de Informática y Sistemas. Cunduacán, Tabasco: UJAT.