Autor: David Suárez

Ciencia de Datos

Reducción de la dimensionalidad – TSNE

t-SNE | T-distributed stochastic neighbor embedding El objetivo es tomar un conjunto de puntos en un espacio de alta dimensión y encontrar una representación fiel de esos puntos en un espacio de menor dimensión, normalmente el plano 2D. El algoritmo

Read More »
Ciencia de Datos

¿Qué es la Reducción de la dimensionalidad?

Muchos problemas de aprendizaje automático constan de cientos o miles de características. Tener un número tan grande de características plantea ciertos problemas. Este problema también se conoce a veces como La Maldición de la Dimensionalidad y la Reducción de la

Read More »
Ciencia de Datos

Introducción a Matplotlib – Lección 1

Introducción La visualización como herramienta toma parte del análisis proveniente del científico de datos para extraer conclusiones de un conjunto de datos. En el artículo de hoy vamos a pasar por la librería Matplotlib. Matplotlib es una librería de terceros

Read More »
Ciencia de Datos

Introducción a NumPy – Lección 1

Introducción NumPy es una biblioteca de terceros para la computación numérica, optimizada para trabajar con arrays unidimensionales y multidimensionales. Su tipo principal es el tipo de matriz llamado ndarray. Esta biblioteca contiene muchas rutinas para el análisis estadístico. Crear, obtener

Read More »
Ciencia de Datos

Introducción a Pandas – Lección 4

Introducción Comenzamos con el cuarto y último artículo de nuestra saga de entrenamiento con Pandas. En este artículo vamos a hacer un resumen de las diferentes funciones que se utilizan en Pandas para realizar el tratamiento de los datos perdidos.

Read More »
Ciencia de Datos

Introducción a Pandas – Lección 3

Introducción Comenzamos con el tercer post de nuestra saga de formación en ciencia de datos con Pandas. En este artículo vamos a hacer un resumen de las diferentes funciones que se utilizan en Pandas para realizar Iteración, Mapas, Agrupación y

Read More »
Ciencia de Datos

Introducción a Pandas – Lección 2

Introducción Comenzamos con el segundo post de nuestra saga de formación con Pandas. En este artículo vamos a hacer un resumen de las diferentes funciones que se utilizan en Pandas para realizar la Indexación, Selección y Filtrado. Indexación, selección y

Read More »
Ciencia de Datos

Introducción a Pandas – Lección 1

Introducción Hoy queremos presentar uno de los primeros capítulos de formación interna en el que introducimos los fundamentos de las herramientas de tratamiento de DataScience. Hablamos de Pandas, Numpy y Matplotlib. Pandas es una biblioteca de terceros para la computación

Read More »
Secured By miniOrange