Migracja do Google Cloud Platform zaowocowała oszczędnościami dla światowego lidera w branży CPG

Challenge
Musieliśmy opracować platformę danych, która mogłaby skutecznie monitorować interakcje w różnych punktach kontaktu i zapewniać wgląd w zachowanie klientów i wykorzystanie produktów w czasie rzeczywistym. Platforma została specjalnie zaprojektowana, aby sprostać wymaganiom firmy Machine Learning i Business Intelligence. Musiał skutecznie gromadzić dane z różnych źródeł, takich jak kliknięcia internetowe, strumień kliknięć aplikacji mobilnych, wydarzenia CIAM i interakcje z Systemu Zarządzania Lojalnością.


Our approach
Aby ułatwić migrację plików parkiet na platformę Google Cloud Platform z innego dostawcy pamięci masowej w chmurze, polegaliśmy na zasobnikach Google Cloud Storage i usłudze STS. Do przyjmowania i transformacji płaskich plików zastosowaliśmy PySpark w Dataproc i załadowaliśmy je do BigQuery. Aby obsłużyć ładowanie zdarzeń z SaaS CDP, wykorzystaliśmy zadania wsadowe Dataflow. Źródła danych w czasie rzeczywistym zostały wchłonięte przez PubSub, a BigQuery służył jako zlew. Zaimplementowano również orkiestrację procesów ETL i dalszego przetwarzania SQL.
The outcome
Platforma danych konsumenckich w ramach Google Cloud Platform służy jako ostateczne źródło dokładnych informacji dla wszystkich modeli Business Intelligence (BI) i uczenia maszynowego (ML). Platforma posiada zdolność do efektywnego radzenia sobie z codziennym przyjmowaniem setek milionów wydarzeń dla klientów. Korzystając z zestawu narzędzi dostarczonych przez platformę Google Cloud, technolodzy marketingowi byli w stanie skutecznie odejść od izolowanego podejścia do przechowywania danych, co pozwoliło uzyskać kompleksowe zrozumienie każdego klienta w czasie rzeczywistym.