Después de usar lagunas herramientas para el estudio de datos como RapidMinder y R me parece que Python es mucho más fácil y rápido para el estudio de datos. Por supuesto R es una gran herramienta que no debemos menospreciar.
Vamos a ver que se necesita para iniciar con el análisis de datos con Python. Podemos hacer dos cosas descargar anaconda que ya tiene varios frameworks para el análisis de datos o podemos instalar Python y luego continuar con la instalación de las otras librerías.
Primero debemos descargar Python https://www.python.org/downloads/ tiene que buscar la versión que aplica para su sistema operativo. En mi caso estoy usando Windows. Tenemos que agregar una variable en el Home para Python. Después de esto podemos correr Python en el cmd
Esto nos mostrara la versión de Python que tenemos instalado y nos permite asegurarnos que los instalamos correctamente.
Ahora debemos verificar que versión de pip tenemos. En el cmd debemos digitar “pip –version”
Pip en Windows se debió haber instalado cuando se instalo Python, pero se podría actualizar si fuera necesario.
Ahora tenemos que instalar algunas librerías que son necesarias para nuestro análisis de datos.
1. Numpy
2. Pandas
3. Matplotlib
4. Scipy
5. Scikit-learn
Estas librerías las vamos a instalar usando PIP con el siguiente comando desde cmd.
“pip install panda”
Ahora solamente se debe cambiar el nombre de la librería que se desea instalar. Cuando terminamos con las librerías vamos a usar el comando “pip freeze” con el fin de ver si tenemos todas las librerías necesarias instaladas.
A continuación, vamos a instalar Jupyter Note para poder ejecutar nuestras operaciones de Python. Se puede usar con otros IDEs pero realmente Jupyter es muy fácil y tiene muy buenas características para hacer nuestro trabajo limpio y rápido.
Igual que las otras librerías tenemos que correr pip install jupyter. Cuando lo tenemos instalados vamos a correr en el cmd “jupyter notebook” esto nos abre nuestro editor de texto para Python.
De esta forma podemos ver nuestro código de Python
Ya estamos listos para trabajar con nuestros proyectos de datos