t-SNE | T-distributed stochastic neighbor embedding El objetivo es tomar un conjunto de puntos en un espacio de alta dimensión y encontrar una representación fiel de esos puntos en un espacio de menor dimensión, normalmente el plano 2D. El algoritmo … Read More
Author Archives: David Suárez

¿Qué es la Reducción de la dimensionalidad?
Muchos problemas de aprendizaje automático constan de cientos o miles de características. Tener un número tan grande de características plantea ciertos problemas. Este problema también se conoce a veces como La Maldición de la Dimensionalidad y la Reducción de la … Read More

Introducción a Matplotlib – Lección 1
Introducción La visualización como herramienta toma parte del análisis proveniente del científico de datos para extraer conclusiones de un conjunto de datos. En el artículo de hoy vamos a pasar por la librería Matplotlib. Matplotlib es una librería de terceros … Read More

Introducción a NumPy – Lección 1
Introducción NumPy es una biblioteca de terceros para la computación numérica, optimizada para trabajar con arrays unidimensionales y multidimensionales. Su tipo principal es el tipo de matriz llamado ndarray. Esta biblioteca contiene muchas rutinas para el análisis estadístico. Crear, obtener … Read More

Introducción a Pandas – Lección 4
Introducción Comenzamos con el cuarto y último artículo de nuestra saga de entrenamiento con Pandas. En este artículo vamos a hacer un resumen de las diferentes funciones que se utilizan en Pandas para realizar el tratamiento de los datos perdidos. … Read More

Introducción a Pandas – Lección 3
Introducción Comenzamos con el tercer post de nuestra saga de formación en ciencia de datos con Pandas. En este artículo vamos a hacer un resumen de las diferentes funciones que se utilizan en Pandas para realizar Iteración, Mapas, Agrupación y … Read More

Introducción a Pandas – Lección 2
Introducción Comenzamos con el segundo post de nuestra saga de formación con Pandas. En este artículo vamos a hacer un resumen de las diferentes funciones que se utilizan en Pandas para realizar la Indexación, Selección y Filtrado. Indexación, selección y … Read More

Entrevista de Ciencia de Datos con David Suárez – Científico de Datos en Apiumhub
Continuamos con nuestra serie de entrevistas (anteriormente habíamos entrevistado a Diego Ojeda – Android Lead en Apiumhub, Serhii Zabolennyi – QA Automation engineer en Apiumhub, Javier Gomez – backend developer en Apiumhub, Cuong Le – Backend developer at Apiumhub & … Read More

Introducción a Pandas – Lección 1
Introducción Hoy queremos presentar uno de los primeros capítulos de formación interna en el que introducimos los fundamentos de las herramientas de tratamiento de DataScience. Hablamos de Pandas, Numpy y Matplotlib. Pandas es una biblioteca de terceros para la computación … Read More