Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

46.79 

Podmiot odpowiedzialny za bezpieczeństwo produktu: Helion S.A., Kościuszki 1c, 44-100 Gliwice (PL), adres e-mail: helion@helion.pl

1 w magazynie

SKU: 100852743 Kategorie: ,

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark – interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.
Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.

Autor

praca zbiorowa

Wydawnictwo

Helion

Rok wydania

2023

Oprawa

miękka

Liczba stron

192

Numer ISBN

9788383220697

Kod paskowy (EAN)

9788383220697

Bezpieczne płatności
Płać bezpiecznie kartą, BLIKiem lub szybkim przelewem.
Darmowa dostawa
Szybka i wygodna dostawa prosto pod Twoje drzwi.
Prezenty i wyprzedaże
Dołącz do newslettera i zyskaj dostęp do wyjątkowych promocji.
Wsparcie
Masz pytanie? Nasz zespół służy pomocą o każdej porze.

Zapisz się do naszego Newslettera!

Bądź na bieżąco z promocjami

Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

46.79 

1 w magazynie