Scroll to top
© 2020, Copyright SoftManagement
-Compartir

Minería de Datos y Machine Learning

Minería de Datos y Machine Learning

Por: John Alexander Alea Millán ~ Arquitecto de Software SoftManagement S.A.

En la actualidad en donde se hablan de temas como la ciencia de datos y de herramientas como R y Python, es importante mencionar a Weka, la cual se desarrolló con fines de investigación en la universidad de Wakaito en Nueva Zelanda, dicha herramienta es fácil de usar y su curva de aprendizaje es rápida, ya que tiene una interfaz GUI, desarrollado en lenguaje Java, la cual facilita su interacción incluso en usuarios que no tengan experiencia en desarrollo.

En términos generales Weka es una herramienta que tiene una gran colección de algoritmos de Machine Learning para minería de datos, los cuales se aplican a un conjunto de datos para la clasificación, regresión, agrupación, reglas de asociación y visualización.

Weka puede acceder a bases de datos utilizando JDBC, en donde puede procesar los datos que devuelve una consulta. Weka es gratuito bajo licencia GNU y se encuentra disponible para sistemas operativos Windows, Linux y OS. Weka trae consigo una gran cantidad de fuentes de datos sobre lo cuales se pueden ejecutar los diferentes algoritmos que provee la herramienta y de esta manera se puede apropiar de una manera fácil al entendimiento del tratamiento de los datos, al ejecutar cada uno de ellos.

Por otro lado, si se tiene una fuente de datos en archivos con extensión csv, estos se pueden migrar a archivos con extensión arff (Weka), cuyo proceso se puede obtener de algunos sitios web, los cuales Weka toma como fuentes de datos.

El enlace en donde se puede encontrar documentación de la herramienta y descargar la misma es la siguiente: https://waikato.github.io/weka-wiki/

Related posts