Los mejores libros de ciencia de datos que deberías leer

Compartir esta publicación

La ciencia de datos es uno de los campos mejor pagados y más populares hoy en día. Y no hay nada mejor que leer libros de ciencia de datos para ponerse en marcha. Aprender ciencia de datos a través de libros te ayudará a tener una visión holística de la Ciencia de Datos, ya que la ciencia de datos no es solo informática, también incluye matemáticas, probabilidad, estadística, programación, aprendizaje automático y mucho más.

Los mejores libros de ciencia de datos que debería leer

1. Practical Statistics for Data Scientists: 50 Essential Concepts por Peter Bruce y Andrew Bruce 

Este libro ofrece una buena visión general de todos los conceptos que hay que aprender para dominar la ciencia de los datos. El libro no es demasiado detallado, pero ofrece información suficiente sobre todos los conceptos de alto nivel, como la aleatorización, el muestreo, la distribución, el sesgo de la muestra, etc. Cada uno de estos conceptos está bien explicado y hay ejemplos junto con una explicación de cómo los conceptos son relevantes en la ciencia de datos. 

Nota importante: Es una referencia rápida y fácil, sin embargo, no es suficiente para dominar los conceptos en profundidad ya que las explicaciones y los ejemplos no son detallados.

Con este libro, aprenderás por qué el análisis exploratorio de datos es un paso preliminar clave en la ciencia de los datos, cómo el muestreo aleatorio puede reducir el sesgo y producir un conjunto de datos de mayor calidad, incluso con grandes datos, cómo los principios del diseño experimental dan respuestas definitivas a las preguntas, cómo utilizar la regresión para estimar los resultados y detectar anomalías, las técnicas de clasificación clave para predecir a qué categorías pertenece un registro, los métodos de aprendizaje automático estadístico que «aprenden» de los datos, los métodos de aprendizaje no supervisado para extraer el significado de los datos no etiquetados.

2. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data por EMC Education Services

Todo el ciclo de vida de la analítica de datos se explica en detalle junto con un caso de estudio y atractivos gráficos para que pueda ver el funcionamiento práctico de todo el sistema. Podrás comprender fácilmente el panorama general de cómo se realiza el análisis, ya que cada paso es como un capítulo del libro. El libro incluye clustering, regresión, reglas de asociación y mucho más, junto con ejemplos sencillos y cotidianos con los que uno puede relacionarse. El libro cubre toda la gama de actividades, métodos y herramientas que utilizan los científicos de datos. El contenido se centra en conceptos, principios y aplicaciones prácticas que son aplicables a cualquier industria y entorno tecnológico.

Este libro te ayudará a convertirte en un colaborador de un equipo de ciencia de datos, a desplegar un enfoque de ciclo de vida estructurado para los problemas de análisis de datos, a aplicar las técnicas y herramientas analíticas adecuadas para el análisis de big data y a aprender a contar una historia convincente con los datos para impulsar la acción empresarial. 

3. Storytelling with Data: A Data Visualization Guide for Business Professionals por Cole Nussbaumer Knaflic

Storytelling with Data te enseña los fundamentos de la visualización de datos y cómo comunicar eficazmente con ellos. Descubrirá el poder de la narración y la forma de hacer de los datos un punto central en su historia. Todo lo que se cuenta como una historia y se muestra en forma de gráficos entra en nuestra mente con facilidad y se queda ahí permanentemente. El libro es bastante impactante y aborda los conceptos fundamentales de la visualización de datos para que entiendas cómo sacar el máximo partido a los enormes trozos de datos disponibles en el mundo real. La forma en que el autor explica cada concepto es totalmente única, ya que lo cuenta en forma de una historia convincente. Ni siquiera te darás cuenta de la cantidad de conceptos que puedes captar en un día de lectura del libro: conocer el contexto y la audiencia, utilizar el gráfico adecuado para la situación adecuada, reconocer y eliminar el desorden para obtener sólo la información importante, utilizar las partes más significativas de los datos y presentarlas a los usuarios. Aprenderá a comprender la importancia del contexto y de la audiencia, a determinar el tipo de gráfico adecuado para su situación, a reconocer y eliminar el desorden que enturbia su información, a dirigir la atención de su audiencia a las partes más importantes de sus datos, a pensar como un diseñador y a utilizar conceptos de diseño en la visualización de datos y a aprovechar el poder de la narración para ayudar a que su mensaje resuene en su audiencia 

4. The data science handbook por Field Cady

No es un libro puramente técnico, sino una referencia rápida, ya que contiene información en forma de preguntas y respuestas de varios científicos de datos destacados. Las preguntas fluyen de forma organizada y ayudan a entender cada aspecto de la ciencia de datos como la preparación de datos, la importancia del big data, el proceso de automatización y cómo la ciencia de datos es el futuro del mundo digital. Este libro proporciona un curso intensivo de ciencia de datos, combinando todos los conocimientos necesarios en una disciplina unificada. El autor también describe los algoritmos clásicos de aprendizaje automático, desde sus fundamentos matemáticos hasta las aplicaciones en el mundo real. La comunicación clara de los resultados técnicos, que es quizás la más infravalorada de las habilidades de la ciencia de datos, recibe su propio capítulo, y todos los temas se explican en el contexto de la resolución de problemas de datos del mundo real. El libro también cuenta con amplios ejemplos de código y tutoriales, tecnologías básicas de «Big Data», incluyendo sus puntos fuertes y limitaciones y cómo se pueden utilizar para resolver problemas del mundo real, cobertura de las realidades prácticas de las herramientas, manteniendo la teoría al mínimo; sin embargo, cuando se presenta la teoría, se hace de una manera intuitiva para fomentar el pensamiento crítico y la creatividad, amplia variedad de estudios de casos de la industria y consejos prácticos sobre las realidades de ser un científico de datos hoy en día, incluyendo el flujo de trabajo general, donde se gasta el tiempo, los tipos de conjuntos de datos trabajados, y los conjuntos de habilidades necesarias. 

5. Business Analytics: The Science Of Data – Driven Decision Making por Dinesh Kumar

Se trata de un libro impresionante y profundo que explica la teoría y las aplicaciones prácticas para ofrecer un conocimiento completo. El autor aborda los temas con sutileza y presenta muchos estudios de casos que son fáciles de entender, comprender y seguir. El libro tiene todo, desde la economía, la estadística, las finanzas y todo lo que necesitas para empezar a aprender la ciencia de los datos. El libro ha sido escrito con mucho esfuerzo y experiencia y la forma en que se han presentado los conocimientos lo demuestra. Incluye herramientas estadísticas y analíticas, técnicas de aprendizaje automático y amalgama muy bien los conceptos básicos y de alto nivel. También aprenderá sobre los modelos escolásticos y six sigma hacia el final del libro.

6. Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management por Michael J. A. Berry y  Gordon S. Linoff  

Un libro maravilloso que explica la minería de datos desde cero. Comienza explicando la era digital, la minería de datos y luego pasa a explicar los tipos de datos que se pueden extraer, los patrones que se pueden extraer, por ejemplo, el análisis de clústeres, el análisis predictivo, las correlaciones, etc., y las tecnologías que se utilizan: la estadística, el aprendizaje automático y la base de datos. Además, este libro cubre temas más avanzados como la preparación de los datos para el análisis y la creación de la infraestructura necesaria para la minería de datos en su empresa. Además, aborda las principales técnicas de minería de datos, como los árboles de decisión, las redes neuronales, el filtrado colaborativo, las reglas de asociación, el análisis de enlaces y el análisis de supervivencia, entre otros.

7. Thinking with Data: How to Turn Information into Insights por Max Shron

Proporciona muchas ideas útiles y permite el pensamiento empresarial crítico del lector. Le ayuda a relacionarse con el porqué de las cosas. A través de los capítulos, aprenderá a formular buenas preguntas con sentido, a anotar los detalles importantes de una idea y a obtener información clave en la que centrarse. Además, cubre muy bien los patrones de razonamiento específicos de los datos. El libro le ayudará a pensar «por qué» y no sólo «cómo». Abarca lo que se denomina CoNVO: contexto, necesidades, visión y resultado. Thinking with Data le ayuda a aprender técnicas para convertir los datos en conocimiento que pueda utilizar. Aprenderá un marco de trabajo para definir su proyecto, incluyendo los datos que quiere recoger, y cómo pretende enfocar, organizar y analizar los resultados. También aprenderá patrones de razonamiento que le ayudarán a desvelar el verdadero problema que hay que resolver.

Este libro le ayudará a entender cómo concretar los detalles de una idea, recibir comentarios y empezar a crear prototipos. 

8. Generative Deep Learning: Teaching Machines to Paint, Write, Compose, and Play por David Foster

El autor ha hecho un trabajo excepcional al plasmar todos los conceptos en forma de historias fáciles de comprender. El modelado generativo es uno de los temas más candentes de la IA. Ahora es posible enseñar a una máquina a destacar en tareas humanas como pintar, escribir o componer música. Con este libro práctico, los ingenieros de aprendizaje automático y los científicos de datos descubrirán cómo recrear algunos de los ejemplos más impresionantes de modelos generativos de aprendizaje profundo, como los autocodificadores variacionales, las redes generativas adversariales (GAN), los modelos codificador-decodificador y los modelos mundiales. A través de consejos y trucos, entenderás cómo hacer que tus modelos aprendan de forma más eficiente y sean más creativos.

9. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking por Foster Provost y Tom Fawcett

El libro hace hincapié en descubrir nuevos casos de negocio en lugar de limitarse a procesar y analizar los datos. Escrito por los renombrados expertos en ciencia de datos Foster Provost y Tom Fawcett, Data Science for Business presenta los principios fundamentales de la ciencia de datos, y le guía a través del «pensamiento analítico de datos» necesario para extraer conocimiento útil y valor de negocio de los datos que recopila. Esta guía también te ayuda a comprender las numerosas técnicas de minería de datos que se utilizan hoy en día. Data Science for Business proporciona ejemplos de problemas empresariales del mundo real para ilustrar estos principios. No sólo aprenderá a mejorar la comunicación entre las partes interesadas del negocio y los científicos de datos, sino también a participar de forma inteligente en los proyectos de ciencia de datos de su empresa. También descubrirá cómo pensar de forma analítica en los datos y apreciar plenamente cómo los métodos de la ciencia de los datos pueden apoyar la toma de decisiones empresariales. Además, te permitirá comprender cómo encaja la ciencia de los datos en su organización y cómo puede utilizarla para obtener una ventaja competitiva. Te mostrará cómo tratar los datos como un activo empresarial que requiere una inversión cuidadosa si quiere obtener un valor real. 

10. Designing data-intensive applications por Martin Kleppmann

Este libro ayuda a comprender la arquitectura de los sistemas de datos de hoy en día y cómo pueden encajar en las aplicaciones que se basan en los datos y son intensivas en datos. El autor aborda varios aspectos del diseño de soluciones de bases de datos y datos y ofrece también muchos otros recursos para que puedas ampliar tus conocimientos sobre el tema. 

11. The Art of Data Science por Roger Peng y Elizabeth Matsui

Este libro describe, de forma sencilla y en términos generales, el proceso de análisis de datos. Los autores tienen una amplia experiencia tanto en la gestión de analistas de datos como en la realización de sus propios análisis de datos, y han observado detenidamente lo que produce resultados coherentes y lo que no produce una visión útil de los datos. Este libro es una destilación de su experiencia en un formato aplicable tanto a los profesionales como a los gestores de la ciencia de los datos.

12. Doing Data Science: Straight Talk from the Frontline by Cathy O’Neil y Rachel Schutt

Una colección de charlas de científicos de datos que trabajan en una variedad de empresas diferentes que está destinada a cortar el bombo y ayudarle a entender cómo funciona la ciencia de datos en el mundo real. Estos expertos no sólo ofrecen conferencias con conocimientos sobre el tema, sino que también comparten estudios de casos y códigos relevantes, profundizando en ejemplos accesibles. Abarca algoritmos, métodos, modelos y visualización de datos, actuando como un recurso técnico práctico, inferencia estadística, análisis exploratorio de datos y el proceso de la ciencia de datos, filtros de spam, Naive Bayes, y la gestión de datos, regresión logística, modelado financiero, motores de recomendación y causalidad, visualización de datos, redes sociales y periodismo de datos, ingeniería de datos, etc. 

13. Predictive Analytics: Data Mining, Machine Learning and Data Science for Practitioners por Dursun Delen

Gracias a las técnicas de análisis predictivo, los responsables de la toma de decisiones pueden descubrir patrones y correlaciones ocultas en sus datos y aprovechar estos conocimientos para mejorar muchas decisiones empresariales clave. 

El enfoque holístico de Delen cubre los procesos y métodos clave de la minería de datos, las técnicas de gestión de datos relevantes, las herramientas y las métricas, la minería avanzada de textos y de la web, la integración de big data y mucho más. Con un equilibrio entre la teoría y la práctica, Delen presenta ilustraciones conceptuales intuitivas, problemas de ejemplo realistas y estudios de casos del mundo real, incluyendo lecciones de proyectos fallidos. Todo ello está diseñado para ayudarle a obtener una comprensión práctica que pueda aplicar para obtener beneficios. Este libro te mostrará cómo aprovechar el conocimiento extraído a través de la minería de datos para tomar decisiones más inteligentes, cómo utilizar procesos y flujos de trabajo estandarizados para hacer predicciones más fiables, cómo predecir resultados discretos, valores numéricos y cambios en el tiempo. También te mostrará cómo los algoritmos de predicción pueden extraerse de la estadística tradicional y del aprendizaje automático avanzado. Descubrirás técnicas de vanguardia y explorará aplicaciones avanzadas que van desde el análisis de sentimientos hasta la detección de fraudes. 

14. Data Science: The Executive Summary – A Technical Book for Non-Technical Professionals por Field Cady  

El experto en ciencia de datos y autor Field Cady describe tanto el «lado empresarial» de la ciencia de datos, incluyendo qué problemas resuelve y cómo encaja en una organización, como el lado técnico, incluyendo las técnicas analíticas y las tecnologías clave. Es perfecto para los ejecutivos que toman decisiones críticas basadas en la ciencia de datos y la analítica, así como para los directivos que contratan y evalúan el trabajo de los científicos de datos. Por último, los propios científicos de datos mejorarán su trabajo técnico con una visión de los objetivos y las limitaciones de la situación empresarial.

15. The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science por Alex Gorelik 

El data lake es un nuevo y atrevido enfoque para aprovechar el poder de la tecnología de big data y proporcionar cómodas capacidades de autoservicio. Este libro se basa en discusiones con profesionales y ejecutivos de más de un centenar de organizaciones, que van desde empresas impulsadas por los datos, como Google, LinkedIn y Facebook, hasta gobiernos y empresas corporativas tradicionales. Aprenderás qué es un lago de datos, por qué las empresas lo necesitan y cómo construirlo con éxito con las mejores prácticas de este libro.

16. Data Science for Business: Predictive Modeling, Data Mining, Data Analytics, Data Warehousing, Data Visualization, Regression Analysis, Database Querying, and Machine Learning for Beginners por Herbert Jones 

La ciencia de datos te ayudarán a tomar mejores decisiones, a saber qué productos y servicios lanzar y a ofrecer un mejor servicio a sus clientes. En esta guía encontrarás los siguientes temas: cómo hacer un análisis exploratorio de datos, minería de datos, algoritmos de aprendizaje automático, modelado de datos, visualización de datos, cómo utilizar la ciencia de datos para ayudar a que su negocio crezca. 

17. Analytics: Data Science, Data Analysis and Predictive Analytics for Business por Daniel Covington

Este libro te enseñará, en términos sencillos y fáciles de entender, cómo aprovechar los datos de sus operaciones diarias y hacer de dichos datos una poderosa herramienta que puede influir en los resultados de su negocio a lo largo del tiempo. El contenido de este libro está diseñado para ayudarle a utilizar los datos en su beneficio para mejorar los resultados empresariales. Además, aprenderás qué pasos hay que dar para realizar un análisis predictivo, qué técnicas hay que emplear para lograr un éxito sostenible, técnicas de regresión, estrategias de aprendizaje automático y consejos para la gestión de riesgos. 

18. The Chief Data Officer Handbook for Data Governance por Sunil Soares 

En este libro, Sunil Soares ofrece una guía práctica para que los directores de datos de hoy en día gestionen los datos como un activo y proporcionen los datos de confianza necesarios para impulsar las iniciativas empresariales, desde las tácticas hasta las transformadoras. La guía describe la relación entre el CDO y el equipo de gobierno de datos, cuya tarea es la formulación de políticas para optimizar, asegurar y aprovechar la información como un activo empresarial alineando los objetivos de múltiples funciones. 

19. Discovering Knowledge in Data: An Introduction to Data Mining por Daniel T. Larose and Chantal D. Larose 

Este libro proporciona las herramientas necesarias para prosperar en el mundo actual de los big data. El autor demuestra cómo aprovechar las bases de datos existentes en una empresa para aumentar los beneficios y la cuota de mercado, y explica los métodos y técnicas de ciencia de datos más actuales.

20. The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists por Carl Shan, William Chen, Henry Wang y Max Song 

The Data Science Handbook contiene entrevistas francas con 25 de los mejores científicos de datos del mundo. Encontrará conversaciones en profundidad sobre sus carreras, historias personales, perspectivas sobre la ciencia de datos y consejos para la vida.   

21. Managing Data Science: Effective strategies to manage data science projects and build a sustainable team por Kirill Dubovikov  

La ciencia de los datos y el aprendizaje automático pueden transformar cualquier organización y desbloquear nuevas oportunidades. Sin embargo, emplear las estrategias de gestión adecuadas es crucial para guiar la solución desde el prototipo hasta la producción. En este libro, explorarás el enfoque adecuado para la gestión de proyectos de ciencia de datos, junto con consejos útiles y mejores prácticas para guiarle en el camino. Tras comprender las aplicaciones prácticas de la ciencia de los datos y la inteligencia artificial, verá cómo incorporarlas a sus soluciones. A continuación, recorrerá el ciclo de vida de los proyectos de ciencia de datos, explorará los escollos comunes que se encuentran en cada paso y aprenderá a evitarlos. Cualquier proyecto de ciencia de datos requiere un equipo capacitado, y este libro le ofrecerá los consejos adecuados para contratar y hacer crecer un equipo de ciencia de datos para su organización. Más adelante, se le mostrará cómo gestionar y mejorar eficazmente sus proyectos de ciencia de datos mediante el uso de DevOps y ModelOps. Al final de este libro, estarás bien versado en varias soluciones de ciencia de datos y habrás adquirido conocimientos prácticos para abordar los diferentes desafíos que encontrarás en el día a día.

22. Principles of Data Science: Learn the techniques and math you need to start making sense of your data por Sinan Ozdemir  

Con un enfoque único que tiende un puente entre las matemáticas y la informática, este libro le lleva a través de todo el proceso de la ciencia de datos. Empezando por la limpieza y la preparación de los datos, y las estrategias y técnicas eficaces de minería de datos, pasará a construir una imagen completa de cómo encaja cada pieza del rompecabezas de la ciencia de los datos. Se familiarizará con el aprendizaje automático, descubrirá los modelos estadísticos que le ayudarán a tomar el control y a navegar incluso por los conjuntos de datos más densos, y descubrirá cómo crear potentes visualizaciones que comuniquen el significado de sus datos.

Espero que te hayan servido estos libros de ciencia de datos y si necesitas ayuda con tus proyectos de ciencia de datos, ¡siempre puedes contar con nosotros!  

Author

  • Ekaterina Novoseltseva

    Ekaterina Novoseltseva is an experienced CMO and Board Director. Professor in prestigious Business Schools in Barcelona. Teaching about digital business design. Right now Ekaterina is a CMO at Apiumhub - software development hub based in Barcelona and organiser of Global Software Architecture Summit. Ekaterina is proud of having done software projects for companies like Tous, Inditex, Mango, Etnia, Adidas and many others. Ekaterina was taking active part in the Apiumhub office opening in Paseo de Gracia and in helping companies like Bitpanda open their tech hubs in Barcelona.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Suscríbete a nuestro boletín de noticias

Recibe actualizaciones de los últimos descubrimientos tecnológicos

¿Tienes un proyecto desafiante?

Podemos trabajar juntos

apiumhub software development projects barcelona
Secured By miniOrange