FMCG

Migracja rurociągów danych i struktur baz danych z Cloudera do usług GCP dla światowego lidera w branży dóbr konsumenckich

Client

Globalna firma FMCG/CPG

Date

Services

Migracja danych

Technologies

Produkty Google Cloud: DataProc, BigQuery, Google Kubernetes Engine

Challenge

Wiele źródeł danych zawierało różne półstrukturalne typy danych i cierpiało na problemy z jakością danych. Celem było zwiększenie efektywności kosztowej kampanii w procesach planowania i zakupów telewizji liniowej poprzez budowę rurociągów wykorzystujących usługi Kubeflow. Podejście to miało na celu usprawnienie ogólnej wydajności systemu, zwiększenie niezawodności transformacji danych i optymalizację procedur reklamowych opartych na Pythonie.

Our approach

Obecne pociągi danych zostały przeniesione do DataProc, GCS i Composer. Aby zwiększyć skalowalność, skonteneryzowaliśmy kod optymalizacji reklam Python, umożliwiając nam wykonywanie rozszerzalnych zadań na Kubeflow hostowanym w GKE. Wykorzystując rurociągi Kubeflow i pule węzłów, możemy efektywnie zarządzać zasobami pracy, biorąc pod uwagę różnorodne zapotrzebowanie na zasoby sprzętowe w różnych scenariuszach. Takie podejście pozwala nam zoptymalizować wykorzystanie zasobów i zapewnić lepsze dopasowanie do określonych wymaganych obciążeń.

The outcome

Rurociągi danych Cloudera zostały pomyślnie przeniesione na platformę GCP. Nowe rurociągi danych zostały ulepszone, aby zapewnić opłacalność i łatwość konserwacji. Szybki czas reakcji jest gwarantowany dzięki wykorzystaniu pamięci podręcznej BigQuery. Wykorzystując obrazy GKE, Kubeflow i Docker, zadania mogą być wykonywane na różnych wersjach kodu i zasobach sprzętowych. Proces inicjowania zadań optymalizacji został usprawniony dzięki wykorzystaniu funkcji w chmurze.

Business Impact

Migracja do GCP zakończyła się sukcesem, co zaowocowało zwiększoną wydajnością, łatwiejszą konserwacją i poprawą niezawodności danych. Osiągnięcie to stało się możliwe dzięki wykorzystaniu niezawodnych usług natywnych w chmurze. Dzięki Kubeflow hostowanemu na GKE czas opracowywania zadań optymalizacyjnych został znacznie skrócony. W rezultacie ostateczne zadania optymalizacji działają teraz w środowisku, które jest zarówno elastyczne, jak i solidne, a jednocześnie jest zoptymalizowane pod względem kosztów.

"Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat."

Name Surname
Position, Company name

Porozmawiajmy i pracujmy razem

Skontaktujemy się z Tobą w ciągu 4 godzin w dni robocze (od poniedziałku do piątku, od 9:00 do 17:00 CET).

Data engineering for cloud-based data processing and storage.
Dominik Radwański
Partner ds. Usług
Administratorem Państwa danych osobowych jest DS STREAM sp. z o.o. z siedzibą w Warszawie (03-840), przy ul. Grochowska 306/308. Twoje dane osobowe będą przetwarzane w celu udzielenia odpowiedzi na pytanie i archiwizacji formularza. Więcej informacji na temat przetwarzania Twoich danych osobowych można znaleźć w Polityka prywatności.
Dziękuję! Twoje zgłoszenie zostało odebrane!
Ups! Coś poszło nie tak podczas przesyłania formularza.