Esta fue la primera herramienta que utilizamos para aprender sobre análisis de datos. Es una herramienta que permite hacer todos los estudios o análisis de los datos de manera gráfica. Es muy intuitiva y fácil de usar.
Esta herramienta esta basada en Java y requiere que se instale el JVM. Tiene la capacidad de correr algún set de datos utilizando diferentes algoritmos. Antes de los análisis de datos cuenta con herramientas para limpieza y visualización de los datos para entenderlos mejor.
Otra de las ventajas es que cuenta con una amplia documentación sobre todos los algoritmos, métodos de limpieza de datos y herramientas con la que se cuenta para el trabajo.
Su instalación es muy simple y fácil. Sin embargo, no es de uso gratuita, pero cuenta con un tiempo de prueba con lo que se puede iniciar a ver si la herramienta es lo que necesitas para iniciar en el mundo del análisis de datos.
Los trabajos realizados con esta herramienta fueron muy rápidos de hacer ya que la herramienta es muy eficiente y permite trabajar con proyectos distintos a la vez. Por ejemplo, cuando se quería hacer un análisis de datos generalmente lo que yo hacia era crear un proyecto, luego lo duplicaba para correr diferentes modelos sobre los mismos datos y poder comprar resultados.
Cuanto con un set de estadísticas para poder comprender cual es el modelo que se ajusta mejor a nuestro análisis.
Al no requerir conocimientos de programación y ser todo grafico me atrevo a decir que cualquier persona podría hacer análisis de datos. Claro después de estudiar un poco que son los modelos, como aplicarlos y además estudiar un poco sobre la limpieza. Esto ya que rapidminer nos permite arrastrar los componentes e iniciar a trabajar.
Adicional a todo lo mencionado antes, se pueden usar diferentes fuentes de datos como archivos de Excel, documentos de texto, SQL, etc. por lo que se puede crear set de datos complejos y con cualquier tipo de información.
Con los modelos listos también se pasó a crear predicciones que fueron rápidas y no genero ningún problema.